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第 一 童 引 论 





Ganns 


“心理 错 计 学 "是 一 门 应 用 统计 学 , 它 要 讨论 的 是 如 何 利 用 数理 绕 计 方法 来 分 析 心 理 
学 以 及 相近 学 科 中 的 研究 资料 。 统 计 学 并 没有 想象 中 的 那么 复杂 和 难 学 ,其 概念 .原理 
和 计算 技术 均 源 自 社 会 生活 本 身 , 是 从 随机 事件 的 概率 分 析 中 发 现 随 机 现象 的 运动 规 
入 ,认证 事 蚁 运动 司 然 性 中 的 落 状 性 ,简明 而 有 趣 。， 在 碍 们 看 来 ,统计 学 是 研 帘 随机 现 章 
的 方法 论 . 是 安 理 学 研究 设计 和 资料 分 析 的 技术 :是 心理 学 实证 研究 站 果 表 和 达 的 有 效 语 
言 ; 是 心理 学 专业 学 生 应 该 热 练 掌握 的 应 用 技术 。 在 心理 学 研究 中 ,可 以 依托 称 名 量 表 ， 
顺序 量 表 , 等 距 量 表 和 等 比 量 表 ,获取 离散 型 和 连 昧 型 的 玫 据 资料 ， 对 于 不 同性 质 的 这 
量 和 载 据 ,所 用 不 同 的 蚊 计 方法 进行 分 析 。 我 们 强调 : 特 鱼 计 学 的 概念 ,原理 ,技术 与 它 
理学 的 研究 横 式 ,生活 中 的 实际 问题 相 结 侣 ,将 统计 学 的 计算 原理 与 SPSS 软件 的 操作 相 


类 合 。 


统计 学 (statistics) 态 数学 ,何以 成 为 心理 党 专业 的 必修 课 ? 不 少 同学 纳 问 。 特 别 是 : 
有 些 同 学 从 小 就 不 喜欢 数学 ,好 不 容易 跨 过 高 考 的 数学 关 , 没 想到 , 教 统计 学 的 教授 又 走 
进 了 你 大 学 的 课堂 “获得 "之 心 油 然 生 成 ,不 是 对 老师 ,而 是 对 统计 学 。"* 敬 萌 " 的 情绪 没 
有 意义 ,你 不 妨 放宽 心态 : 随 那些 寄 智 的 教授 去 讨论 随机 事件 。 等 着 瞧 吧 ,你 会 着 迷 的 ， 
因为 统计 学 中 草 蕊 着 无 限 的 美妙 。 可 能 你 没有 想到 ,统计 学 能 应 用 于 从 才学 科 , 心 理学、 
教育 学 ,社会 学 .生物 学 .…… ,其 至 物理 学 ! 还 记得 杨利伟 从 赤 空 返回 地 球 时 指挥 中 心 








在 内 蒙 草 原 划 出 一 个 宽广 的 降落 区 吗 ? 他 会 落 在 哪 一 点 ? 谁 能 完全 说 得 淮 呢 ! 任何 事 


物 的 运动 变化 都 具有 随机 性 ,但 随机 之 中 有 必然 。 统计 学 就 是 研究 随机 事件 运动 规律 的 
科学 ,就 是 要 寻找 偶然 中 的 必然 性 。 





第 一 节 为 什么 要 学 习 统 计 学 
选择 心理 学 ,是 要 了 解 人 的 心理 活动 的 规律 ,将 来 失事 与 人 有 关 的 工作 ,又 不 是 都 去 
做 科学 家 ,难道 也 要 学 习 统计 学 吗 ? 对 心理 学 来 说 ,统计 学 是 什么 ? 
一 、 统 计 学 是 研究 随机 现象 的 方法 论 
从 方法 论 的 角度 看 ,统计 学 贯彻 着 形而上学 的 因果 决定 论 , 同 时 又 充满 办证 法 的 
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世间 万 物 , 变 化 是 永恒 的 ,所 有 的 变化 都 有 原因 。 当 原因 太 多 , 太 复 杂 和 和 具有 不 确定 
性 时 ,变化 的 过 程 和 结果 也 就 具有 了 下 确定 性 , 即 通常 所 说 的 随机 性 。 任 何事 物 的 变化 
都 具有 随机 性 ,但 随机 之 中 有 必然 ,二 者 辨证 统一 。 统 计 党 的 方法 能 够 帮助 我 们 从 随机 
性 中 爱 再 必然 性 ,这 种 必然 性 叫做 统计 规律 ,是 在 对 大 量 随机 事 性 的 观测 和 统计 分 析 中 
发 现 的 。 

“随机 之 中 有 必然 ", 这 和 句 话 也 可 以 颠倒 过 来 说 :必然 性 会 被 随机 性 所 挫 盖 ! 于 是 统 
计 学 的 逻辑 变 得 简单 了 :通过 对 随机 事件 的 观测 与 统计 分 析 来 把 握 随 机 现象 的 变化 , 然 
后 将 其 中 的 随机 性 剥落 ,隐藏 在 随机 之 中 的 必然 规律 也 就 是 露出 来 了 。 














十 过 抛 人 硬币 游戏 吧 ? 把 质地 均匀 的 硬币 随机 地 往 上 抛 起 ,上 上 升 ,下 降 , 硬 币 落 在 你 的 
手掌 上 或 泉 面 上 , 哪 一 面 朝 上 ,能 够 事先 确 知 吗 ? 不 能 ! 要 必 A 面 朝 上 ,要 避 台面 朝 上 ， 
这 就 是 随机 性 - 因为 随机 性 ,你 从 这 一 次 试验 发 现 不 了 规律 。 你 不 能 根据 这 一 次 试验 的 
结果 是 A 面 朝 上 或 B 面 朝 上 就 说 如 此 抛 投 和 硬币 的 结果 总 是 A 面 彰 上 或 B 面 朝 上 。 再 投 
一 次 ,结果 可 能 一 样 但 也 可 能 不 一 样 。 要 想 清楚 其 中 的 规律 ,就 要 投 很 多 次 硬币 。 比 如 
投 10 次 ,结果 会 怎样 呢 ? 还 是 具有 不 确定 性 ,A 面 朝 上 的 次 数 可 以 是 0.1.2.…1+ .10, 北 
有 11 种 可 能 。 这 能 让 我 们 发 现 规律 吗 ? 还 是 不 能 ,所 以 还 要 投 很 多 次 , 当 次 数 很 多 的 时 
候 , 作 会 发 现 ,A 面 和 B 面 袁 上 的 次 数 均 接近 50%, 这 就 是 规律 。 所 以 ,运用 统计 学 去 迷 
现 规律 ,常常 要 求 试验 次 数 或 观测 随机 事件 的 次 数 足 够 多 , 即 所 谓 的 去 样本 。 比 如 ,要 测 
量 你 所 在 学 校 学 生 的 智力 水 平 :有 的 学 生 智 商 是 110, 有 的 学 生 智 商 是 95,…… ,测量 结 
末 也 趟 确定 ,具有 随机 性 。 所 以 ,测量 一 个 学生 不 能 反映 全 部 学 生 的 智商 分 数 , 那 就 宗 测 
一 些 同 学 ,你 可 能 会 发 现 ,这 些 学 生 的 智商 围绕 着 某 一 个 居中 的 数据 上 下 波动 。 这 个 居 
中 的 数据 往往 能 更 好 地 代表 学 生 的 水 平 , 而 且 用 这 个 数据 描述 全 体 同 学 的 智商 水 平 , 比 
用 某 一 个 同学 的 智商 描述 全 体 同 学 的 智商 水 平 要 可 靠 得 和 多。 大 家 非常 认同 这 一 点 。 有 有 
没有 意识 到 :统计 掌 要 讲 的 这 些 方 法 和 逻辑 ,你 其 实时 就 知道 ,而 且 生 活 中 就 是 这 样 使 用 
的 ,不 是 吗 ? 

统计 学 总 是 要 求 观测 大 样本 蚂 ? 现实 中 并 不 是 总 能 做 到 这 一 点 。 那 么 小 样本 如 何 
能 够 保证 认识 到 事件 的 规律 昵 ? 刚 才 所 说 的 抛 投 10 次 硬币 ,会 有 11 种 可 能 的 结果 ,这 
肯定 难以 保证 规律 的 发 现 。 不 过 ,如 果 我 们 让 许 才 同学 分 别 抛 投 10 次 硬币 ,统计 一 下 把 
面 朝 上 为 0.1,2 ,ee 10 这 11 种 结果 发 生 的 次 数 种 是 多 少时 ,就 会 发 现 居中 的 5 发 生 的 
频数 最 多, 接近 5 的 结果 也 有 较 高 的 频数 ,远离 5 的 0 和 10 出 现 的 次 数 都 极 少 。 由 此 ,我 
们 又 得 出 结论 :观测 一 个 样本 的 结果 ,具有 随机 性 ;观测 入 多 个 样本 时 ,就 能 发 现 规律 。 
所 以 评 允 时候, 统计 学 不 是 用 一 个 对 银 或 一 个 样 束 的 观测 结果 去 认识 规律 ;而 是 用 许 过 
样本 观测 的 结果 去 认识 规律 ,用 一 个 样本 的 观测 结果 去 预测 各 种 铺 果 发 生 的 概率 .我 们 
不 能 确定 抛 投 10 次 硬币 A 面 朝 上 的 次 数 一 定 是 多 少 ,但 是 我 们 可 以 利用 统计 学 方法 , 确 
定 态 面 朝 上 为 *0,1 ,2 "10" 等 11 种 结果 发 生 的 概率 各 是 多 少 ,而 且 知 道 : 为 5 的 概 
率 最 高 ,为 0 和 150 的 概率 最 低 ， 

统计 学 研究 的 就 是 随机 现象 ,是 帮助 人 们 发 现 随 机 现象 运动 规律 的 科学 。 其 基本 技 
术 就 是 分 析 随 机 现象 的 各 种 表现 ,认识 随机 事件 发 生 的 概率 及 分 布 规律 。 





二 、 统 计 学 是 心理 学 研究 设计 的 技术 


心理 学 及 其 他 行为 科学 领域 的 研究 者 ,经 常 接触 大 量 的 具有 随机 性 的 数据 资料 。 如 
何 充分 利用 这 些 资料 所 蕴涵 的 信息 ,发 现 其 中 的 规律 性 ,用 以 指导 人 们 的 实践 ,是 一 个 很 
重要 的 问题 。 初 涉 研究 的 青年 学 生 , 经 常 遭 遇 这 样 的 乾 炊 :在 课程 学 习 或 学 位 论文 工作 
中 ,翻译 文献 .拟定 题目 ;再 到 辛 辛 苦 苦 地 做 实验 、 做 调查 ,收集 数据 资料 ;到 了 分 析 数 据 
资料 的 时 候 却 “ 卡 了 党 "”。 于 是 找到 导师 ,导师 皱 着 眉头 ,看 了 半天 光 噢 "了 一 声 , 似 有 所 
悟 , 最 后 说 :研究 设计 有 问题 ,不 符合 统计 学 的 要 求 , 所 以 一 些 数据 统计 技术 不 能 用 ! 前 
期 工作 中 始终 高 涨 的 研究 热情 ,一 下 子 消失 至 尽 。 

心理 统计 学 是 应 用 统计 学 的 一 个 分 支 , 它 不 仅仅 是 对 已 有 数据 资料 进行 分 析 的 技 
术 , 也 是 根据 研究 目的 和 研究 对 象 的 特点 ,确定 搜集 何 种 资料 .如 何 搜集 .如 何 整 理 . 如 何 
分 析 以 及 如 何 根据 这 些 数 字 资 料 所 传递 的 信息 ,进行 科学 推论 , 找 出 客观 规律 的 一 门 
科学 。 

在 谈 及 心理 统计 学 的 基本 内 容 时 ,不 少 学 者 都 认为 有 三 个 部 分 :描述 性 统计 、 推 断 性 
统计 和 研究 设计 。 其 中 研究 设计 部 分 ,就 是 讨论 如 何 设计 实验 或 调查 方案 ,使 搜集 来 的 
数据 资料 能 最 有 效 地 反映 所 欲 研究 的 问题 ,并 使 数据 的 意义 更 丰富 ;讨论 采用 什么 方法 
对 搜集 来 的 数据 资料 进行 整理 分析, 使 其 所 蕴藏 的 信息 得 以 最 充分 地 显现 ,实现 对 实验 
或 调查 结果 的 科学 解释 , 找 出 事物 的 客观 规律 。 心 理学 作为 一 门 科学 ,其 实证 资料 的 积 
累 主要 依靠 两 种 方法 :科学 实验 法 .心理 测量 法 。 不 过 ,科学 实验 和 心理 测量 都 有 局 限 
性 :心理 学 实验 或 测量 搜集 来 的 数据 资料 ,往往 来 自 于 局 部 对 象 。 仅 赁 少数 人 的 经 验 直 
接 得 出 结论 是 不 可 靠 的 ,如 何 从 局 部 得 来 的 资料 推论 全 局 的 情形 ,得 出 合乎 规律 的 科学 
结论 ,只 有 借助 于 统计 学 才能 实现 。 可见, 心理 统计 学 是 对 心理 学 研究 的 全 程 进行 管理 
的 科学 : 它 从 研究 设计 的 环节 开始 ,一 直到 数据 分 析 及 其 结果 解释 ,都 起 到 非常 重要 的 作 
用 ,是 心理 学 研究 不 可 缺少 的 科学 工具 。 

科学 实验 中 获得 的 数据 ,大 都 具有 随机 性 .统计 学 就 是 利用 这 种 随机 性 ,分 析 其 
中 的 规律 。 统 计 学 是 适应 科学 研究 的 需要 而 发 展 起 来 的 一 种 有 效 工 具 , 其 理论 基础 就 
是 关于 随机 现象 的 概率 论 。 数 理 统计 学 ,侧重 于 数理 统计 原理 与 方法 的 数学 证 明 ; 而 
心理 统计 学 侧重 于 讨论 统计 方法 如 何 应 用 到 心理 学 的 研究 中 ,对 于 统计 方法 及 其 应 用 
的 条 件 、 如 何 解 释 分 析 所 得 的 结果 等 介绍 较 多 ,对 各 种 统计 方法 及 公式 的 推导 、 理 论说 
明 则 较 少 。 一 般 来 说 ,心理 统计 学 所 介绍 的 方法 ,是 数理 统计 学 已 确认 的 - 但 随 着 心 
理学 研究 的 发 展 和 深信 ,实验 中 会 提出 更 多 的 数据 分 析 问 题 需 要 心理 统计 学 加 以 解 
决 ,这 又 为 统计 学 提供 或 补充 了 新 的 研究 内 容 。 可 见 , 数 理 统计 学 与 心理 统计 学 既 有 
区 别 , 又 有 联系 。 统 计 学 中 的 不 少 内 容 简直 就 可 以 看 成 是 心理 学 研究 的 解决 方案 或 设 
计 方 案 。 ， 

虽然 说 ,学 习 了 数理 统计 学 的 理论 和 方法 ,并 不 一 定 能 从 事 心理 学 的 实验 研究 或 各 
种 定量 调查 。 但 是, 如果 没有 学 习 心 理 统计 学 ,即使 系统 学 习 了 心理 学 的 其 他 相关 课程 ， 
例如 实验 心理 学 ,心理 测量 学 ,也 依然 难以 胜任 研究 设计 ,因为 心理 统计 学 是 心理 学 研究 
设计 的 基本 方法 学 基础 。 
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三 、 统 计 学 是 心理 学 研究 资料 分 析 的 技术 

心理 学 的 实验 研究 和 调查 研究 要 解决 什么 问题 昵 ? 简单 地 说 ,主要 有 三 类 ， 

-是 特征 描述 , 即 对 研究 对 象 进 行 多 方面 的 测量 ,如 心理 品质 的 测量 .情绪 状态 的 淹 
量 , 生 理 指标 的 测 基 ,行为 倾向 的 测量 等 等 ， 此 类 测量 一 般 不 是 为 了 撒 述 个 体 , 也 不 是 为 
] 摘 述 少 数 的 一 些 信 ,更 多 地 是 为 了 描述 一 个 大 的 群体 ,但 是 实际 参加 测量 的 只 能 是 少 
数 个 体 . 比如 ,为 了 调查 中 国 贷 众 对 手机 品牌 的 偏好 ,你 乎 可 能 针对 中 国 所 有 手机 用 户 
进行 彰 查 ,只 能 调查 其中 很 小 的 一 部 分 人 ,然后 推 基 中国 公 杂 对 手机 品牌 的 偏好 。 这 里 
所 说 的 中 国会 区 中 的 手机 用 户 构 成 了 一 个 很 大 的 人 群 ,统计 学 上 将 其 称 为 “总 体 ”"(popu- 
lation)。 你 实际 调查 到 的 那 一 小 部 分 手机 用 户 , 就 是 来 自 这 个 总 体 中 一 个 很 小 的 样本 
(samiple)* 其 铀 量 结果 所 反映 的 特征 在 某 种 程度 上 代表 了 总 体 的 特征 ,心理 统计 学 用 平 
均 数 .中 位 数 . 共 数 等 集中 量 数 描述 样本 的 特征 ,并 由 此 估计 总 体 的 特征 :用 标准 差 、 方 
差 .四 分 位 距 等 描述 样本 数据 的 分 散 程 度 , 进 市 估计 标准 误 来 反映 总 体 数 据 的 分 散 程 度 . 
描述 性 统计 分 析 是 统计 学 中 数据 分 析 的 最 基础 的 部 分 ， 

是 进行 莽 寞 比较 ,以 考察 不 同人 群 之 间 的 某 些 差异 ,以 及 实验 干预 是 否 造 成 了 某 

种 心理 理 品 质 或 心理 状态 的 明 显 改 变 。 比 如 ,一 般 性 的 比较 言语 材料 记忆 的 性 别 差 异 , 认 
若 策略 发 展 的 年 级 差异 ,心理 健康 水 平 的 校 际 差异 ;临床 上 比较 服药 组 和 控制 组 由 者 病 
情 转变 进程 ;实验 心理 学 上 比较 不 同感 觉 通道 接受 刺激 的 反应 时 间 长 短 等 等 。 这 类 研究 
名 忆 心 理学 实验 研究 的 方式 出 现 , 其 数据 资料 分 析 主 要 是 依赖 于 心理 统计 学 中 的 + 检验 
和 办 验方 法 。 有 了 1 检验 和 下 检验 等 方法 ,研究 者 就 可 以 从 样本 数据 的 差异 性 推断 样 
夺 所 在 总 体 之 闻 是 否 存 在 差异 ,或 者 说 ,可 以 推断 总 体 之 间 的 差异 性 程度 . 

三 是 相关 性 分 析 以 及 基于 相关 分 析 进 行 的 距离 判断 ,回归 分 析 , 聚 类 分 析 和 因子 分 
析 , 也 和 包括 测 基 学 中 的 信和 度 分 析 等 等 。 相 关 性 研究 ,一 般 是 尽量 在 较为 自然 的 情况 下 , 搜 
集 研究 对 象 的 一 系列 心理 体验 .行为 倾向 或 行动 指标 ,利用 统计 学 方法 ,来 考察 各 方面 变 
世 对 应 的 数据 资料 之 间 是 天 具有 某 种 共 变 关系 。 变 量 间 的 共 变 美 系 就 是 指 一 个 变量 随 
着 男 一 个 变量 的 变化 而 变化 ,表现 出 某 种 变化 关联 性 , 即 相关 。 心 理学 研究 中 ,如 果 发 现 
六 变量 与 变量 之 间 存 在 某 种 变化 关联 性 ,往往 意味 着 这 两 个 变量 之 间 存 在 两 种 美 系 中 的 
一 种 : 因 系 关系 .全 在 共同 因子 。 一 般 借 助 于 心理 测验 量 表 开 展 的 研究 ,更 多 地 要 用 到 相 
关 分 析 , 包 括 信和 度 和 效 度 检验 .调查 项 目 之 间 的 相关 性 ,项 目 之 间 是 天 存在 内 部 结构 即 存 
在 公共 因子 等 等 ,所 有 这 些 均 可 以 用 心理 统计 学 来 解决 。 


四 、 统 计 学 为 心理 学 研究 提供 了 有 效 的 表达 语言 

心理 统计 学 已 经 成 为 心理 学 专业 本 科 生 和 研究 生 的 必修 课程 ,也 成 为 心理 学 研究 者 
的 重要 知识 基础 ,其 基本 符号 .基本 术语 ,结果 表达 方式 和 解释 方式 已 经 成 为 它 理 学 研究 
报告 的 语言 要 素 ,成 为 心理 学 实证 研究 者 的 语言 习惯 。 简 单 地 说 ,统计 学 已 经 成 为 心理 
学 研究 结果 表达 的 有 效 语 言 。 

Rn 月, 很 容易 地 找到 类 似 下 面 的 结果 

a 结果 表明 ,1SI 的 主 效 应 非常 显著 ,Fi(1,120) 


一 8 13， 记 < 01 EL1,687 一 96.45 ,<0.001。 随 着 IST 延长 ,对 入 觉 词 的 反应 时 这 二。 
视觉 词语 音 的 主 痪 应 非常 显著 ,Fifl,120) 一 16. 59, 记 < 一 0.001; Fl1,68) 一 64.85, 户 一 
0.001。 必 TSI 和 视觉 词语 音 的 交 吾 必用 显著 ,F(t1,120) 二 4.63, 记 过 0.05。 障 单 效 应 分 
新 表明 ,了 D, 

统计 学 的 语言 已 经 在 相当 程度 上 成 为 心理 掌 研 究 报告 撰写 的 “ 行 话 ", 这 对 我 们 提出 
了 两 点 要 求 : 一 是 ,要 异 助 统计 学 的 知识 阅读 心理 党 的 研究 报告 ;二 是 ,在 撰写 研究 报告 
的 时 候 : 要 使 用 统计 学 的 概念 与 符号 说 "内行 " 话 。 


五 、 统 计 学 成 为 心理 学 专业 的 应 用 技术 


近年 来 , 越 来 越 多 的 心理 学 专业 毕业 生 进 入 企业 或 公司 ,从 事 人 力 资源 管理 .品牌 济 
斌 和 产品 界面 评价 工作 。 我 也 受理 了 越 来 越 多 类 似 的 已 毕业 学 生 的 求援 ;他 们 一 般 会 先 
自我 检讨 一 备 , 说 些 当 初学 统计 学 ,SPSS 时 不 赤 用 功 而 学 业 不 精 的 话 , 然 后 是 诸如 “这 个 
多 项 选择 方式 的 调查 资料 怎么 处 理 ”“ 这 个 是 使 用 聚 类 分 析 的 方法 处 理 吗 "“ 这 个 因子 分 析 
要 怎样 确定 国 子 数 呢 "" 老 总 要 我 一 周 内 拿 出 数据 分 析 报 告 , 我 该 怎么 办 啊 " 之 类 的 话语 ， 

此 类 情形 , 旱 在 我 预料 之 中 ,尽管 当初 我 会 不 断 地 强调 统计 学 的 重要 .SPSS 的 便利 ， 
但 没有 过 “难为 "体验 的 时 候 , 自 然 会 有 学 生 把 老师 的 话 当 作 * 耳 旁 风 ”"。 这 很 正常 ,我 们 
不 是 党 说 ,“ 实 践 才 是 最 好 的 老师 " 嘛 ! 其 实 , 作 为 教师 ,我 们 并 不 要 求学 生 在 进入 实践 领 
域 之 前 就 一 定 要 掌握 允 少 的 技能 操作 ,我们 只 希望 他 们 能 够 在 大 学 的 学 习 中 掌握 一 些 基 
本 的 理论 ,概念 和 操作 之 后 ,学 会 自己 解决 问题 ,学 会 借助 于 各 种 文献 和 工具 书 去 自学 ， 

今天 的 中 国 社会 ,对 心理 学 有 了 更 名 的 期 待 ,几乎 所 有 的 实践 领域 都 有 心理 学 可 以 
作为 的 地 方 : 但 是 有 一 点 ,心理 掌 伙 须 在 技术 层面 有 所 发 展 和 应 用 ,包括 各 种 和 不同 性质 、 
不 同 规模 的 数据 资料 分 析 技 术 的 发 展 和 应 用 。 党 习 了 心理 统计 学 .你 就 可 以 将 一 个 理论 
的 假设 转变 为 一 项 实证 研究 的 方案 ;你 就 可 以 借助 于 各 种 测评 工具 对 各 个 和 不同 实践 领域 
中 的 人 和 群 进行 心理 测评 与 支持 + 你 就 可 以 帮助 企 事 业 单 位 进行 人 力 资源 的 开发 与 管理 
你 就 可 以 编制 一 套 有 效 的 评 佑 指标 对 一 些 品 牌 进 行 市 场 调查 ,你 就 可 以 从 纷繁 的 数据 将 
料 中 发 现 样本 与 总 体 的 特征 ,变量 之 间 的 预测 关系 ,隐藏 于 人 的 表面 行为 背后 的 潜在 人 
格 特质 等 等 。 

熟练 地 掌握 了 统计 学 和 SPSS 应 用 ,你 就 于 了 一 双 问 眼 , 能 洞察 复杂 中 的 简单 :就 会 
成 为 行为 科学 领域 中 的 “多面 手 ”, 许 多 问题 不 再 成 为 问题 。 


第 二 节 心理 学 研究 中 测量 的 性 质 


一 、 数 字 的 特性 与 测量 


(一 ) 数字 的 特性 
从 古老 的 人 类 ,到 现代 或 者 说 后 现代 人 ,对 数字 (data) 的 依赖 程度 都 是 很 高 的 。 数 字 


呈 ” 张 积 家,. 陈 相 井 ;句子 彰 景 下 缺 先 音素 的 中 变 昕 融 词 理解 的 音 训 沂 活 进 如 ,心理 学报 3 ,2005,3705) ,第 584 页 ， 
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系统 来 源 于 人 类 对 现实 生活 现 党 的 高 度 抽象 和 高 座 符 号 化 ,是 高 级 思维 的 产物 。 从 某 种 
意义 上 说 ;现代 大 学 中 的 数学 课程 也 是 一 种 思维 方式 的 训练 课 , 它 不 仪 可 以 帮助 学 生 接 
受 这 样 一 种 高 级 思维 氛围 的 各 陶 , 而 且 使 我 们 对 事物 的 把 握 更 便利 ,这 种 便利 来 自 于 数 


_ 子 本身 具 有 的 特征 。 





数字 作为 自然 数 时 ,至 少 具有 四 方面 特征 :一 是 同一 性 或 区 分 性 ,1 就 是 1,2 就 是 
2 不 同 数 字 可 以 有 效 反 映 事 物 属性 的 某 种 规定 性 或 差异 性 ,比如 当 盘 子 里 有 三 个 
苹果 时 ,你 可 以 说 3 个 而 不 能 说 1 个, 另 一 个 盘子 里 是 一 个 苹果 ,可 以 说 是 1 个 而 不能 说 
是 3 个 。 用 数字 可 以 区 分 事物 的 特征 。 二 是 等 级 性 或 位 次 性 。 用 数字 1.2.3,…'… 可 以 有 
效 地 反映 诸如 襄 好 程度 ,情绪 强度 ,教育 层次 ,态度 偏向 ,比赛 名 次 .考试 成 绩 排 列 顺序 等 
信息 。 三 是 等 距 性 。 数 字 本 身 包 含 着 “等 距 性 ,比如 2 比 1 大 1;8 比 ? 也 是 大 1-…… 。 这 
种 等 距 性 可 以 有 效 地 反映 事物 之 间 在 某 些 属性 上 的 差异 程度 。 特 别 是 在 具有 相等 单位 
的 度量 系统 中 , 它 能 准确 地 表达 两 个 事物 的 某 种 差异 性 。 例 如 29 亿 的 气温 比 155 的 气 
温 高 5C ;37 亿 的 气温 比 325 的 气温 也 是 高 5 ,这 两 个 差异 量 相 等 。 四 是 可 加 性 。 数 字 
本 身 的 可 加 性 可 以 有 效 地 反映 事物 相 加 后 产生 的 结果 。 比 如 数字 的 "2 十 3 二 5", 使 得 我 
Ep 5m"”。 当然 ,在 实际 应 用 时 ,数字 相 加 是 有 条 忻 的 , 它 
需要 相等 的 单位 ，。 





利用 数字 ， 可 以 有 效 地 把 握 事物 特征 ， 但 是 要 实现 这 一 点 ,需要 测量 。 也 就 是 说 ,要 
想 把 事物 属性 转化 为 数字 刘 料 ,需要 借助 于 测量 。 


(= 测量 的 滔 义 及 要 素 





测量 的 对 象 ， 其 属性 构成 测量 的 自 标 ， 入 出 对 叱 六 是 过关 中 必需 加 煌 的 识 攻 和 执 本 的 
序 , 以 及 必须 的 工具 + 数字 是 测量 结果 的 表达 形式 , 即 以 数字 表达 的 结果 是 测量 的 直接 结 
果 。 比 如 :要 测量 一 张 捍 子 的 长 度 , 桌 子 是 测量 对 象 ! 长 度 是 测量 的 目标 ;尺子 是 铀 量 的 
工具 ;而 调和 量程 序 要 求 将 斥 子 的 0 刻度 与 桌子 一 端 迎 缘 对 齐 , 读 取 桌 子 另 一 端 边缘 与 尽 
于 相对 的 刻度 值 ,该 刻度 值 如 果 是 120cm, 即 得 到 120 这 个 数字 所 表达 的 测量 铺 果 。 再 比 
如 要 测量 中 学 生 的 认 知 策略 水 平 , 中 学 生 是 测量 对 象 ; 其 认 知 策略 的 发 展 水 平 是 市 量 目 
标 ; 编 制 的 " 认 知 策略 测验 "是 工具 ;要 求学 生 按照 调 验 的 标准 化 程序 进行 反应 , 即 就 认 知 
策略 测验 中 的 每 一 个 题目 作出 回 竺 ,根据 学 生 的 回答 或 反应 :参照 计 分 规则 得 到 学 生 的 
一 个 分 数 , 再 根据 这 个 分 数 在 常 模样 本 中 的 排 位 得 到 该 学 生 认 知 策略 水 平 的 标准 排 位 
数字 ， 

测量 一 般 需要 两 个 要 束 , 即 参照 点 和 单位 .要 确定 事物 的 量 . 必 须要 有 一 个 计算 的 
起 点 ,这 个 起 点 就 叫做 参照 点 。 生 上 照 点 也 叫 零点 ,包括 绝对 零点 和 相对 零点 丙种。 例如 


”测量 身高 .体重 等 都 是 以 零 为 参照 点 的 ,这 个 零点 的 意义 是 "无 ,表示 测 不 到 长 度 或 重 


其 。 必 一 种 零点 是 人 为 设 定 的 参照 点 , 即 相 对 零点 ,例如 摄氏 温度 的 零点 是 人 为 规定 的 
水 的 冰点 温度 值 。 如 果 一 个 测量 系统 有 一 个 绝对 零点 ,就 可 以 测量 到 精确 的 饮 对 量 , 但 
在 有 些 领 域 这 个 绝对 零点 不 存在 或 很 难 确定 ,只 能 采用 人 为 标定 的 相对 零点 ,其 测量 结 
果 具 有 相对 性 。 





单位 是 测量 的 男 一 要 案 , 其 种 类 ,名 称 紧 多 ,即使 是 测量 同一 事物 的 同一 种 属性 ,也 
有 许 才 种 不同 的 单位 可 供 选用 。 比 如 ,重量 的 测量 单位 可 以 有 人 毫 克 . 克 .千克 . 吨 等 。 好 
的 单位 要 具备 两 个 条 件 : 一 是 确定 的 意义 , 妈 对 同一 单位 ,所 有 人 的 理解 是 一 致 的 ,意义 
要 相同 :二 是 相同 的 价值 . 即 相 邻 两 个 单位 点 问 的 差别 量 是 相等 的 。 


(三 ) 测量 量 表 

测量 是 在 定 有 单位 和 震 上 照 点 的 连续 体 上 把 事物 的 属性 表示 成 数字 ,该 连续 体 就 是 量 
表 tscale)。 如 要 测量 某 事物 的 属性 ,只 要 将 谷 测 量 的 该 事物 局 性 放 在 这 个 连续 位 的 适当 
位 置 上 .看 它们 距 参 照 点 的 远近 , 便 会 得 到 一 个 测量 值 ,这 个 宙 如 值 就 是 对 这 一 属性 的 数 
其 化 说 明 ， 

由 于 制订 量 表 的 单位 和 参照 点 不 同 , 量 表 的 种 类 也 和 不同。 根据 基 表 的 精确 程度 ,斯 
昔 立 斯 3，5. Stevens) 将 测量 从 低级 到 高 8 分 成 四 个 水 平 , 即 称 各 量 表 . 顺 序 量 表 ,等 距 
她 表 和 等 比 莽 表 ， 

1. 敌 言 量 表 (meminal scale) 

称 和 名 量 表 是 测量 水 平 最 低 的 一 种 量 表 形 式 , 既 无 参照 点 和 单位 ,也 没有 等 级 或 位 次 
性 ,只 是 用 不同 的 数字 作为 代码 区 分 事物 在 革 种 性 质 上 的 差异 .其 数 宇 已 经 失去 了 目 然 
数 的 意外 。 这 种 量 表 又 分 为 两 种 :(1) 代 号 :用 数字 来 代表 个 别 事物 , 如 学 生 的 学 号 ,运动 
员 上 比赛 时 的 号 码 等 ;(2) 类 别 : 用 数字 来 代表 具有 某 一 属性 的 事物 的 全 体 , 即 把 一 些 事物 
确定 到 不 同性 质 的 类 别 中 ,如 性 别 届 性 .可 用 1 代表 女 .2 代表 男 , 就 把 人 规定 到 两 类 中 
了 ;还 比如 在 调查 中 ,涉及 到 的 调查 对 象 包括 文 , 理 .工艺 术 四 类 专业 的 大 学 生 , 也 可 以 
用 1.2.3.4 把 调查 对 象 规 定 到 四 个 类 别 中 去 。 

在 称 和 名 量 表 中 ,数字 只 具有 标记 性 质 , 不 能 作 数 量化 的 分 析 , 没 有 大 小 变化 的 关系 ， 
因此 下 能 作 加 , 减 , 乘 . 除 的 运算 。 

2 . 厢 床 量 毒 (ordinal scale) 

顺序 量 琢 也 叫做 等 级 量 表 . 该 类 量 甫 可 以 用 一 组 数字 将 事物 规定 为 不 同 的 类 别 , 其 
测量 的 水 平 识 于 称 名 量 表 .因为 它 的 数 宇 不仅 可 以 具有 标记 类 别 的 功能 ,同时 也 含有 类 
别 的 天 小 或 革 种 属性 的 程度 高 低 的 比较 关系 。 如 学 生 的 年 级 ,可 以 用 1 年 级 ,2 年 级 ,3 
年 级 等 将 学 生 规定 为 不 同 的 类 别 . 同 时 也 表达 了 教育 程度 的 高 低 , 有 一 定 的 排列 硕 序 。 
学 生 考 试 成 绩 的 等 级 .职员 工资 级 别 . 消 费 者 封 各 种 品牌 手机 的 喜好 程度 等 . 当 用 数 宇 表 
示 的 时 候 , 其 中 都 世 含 某 种 顺序 或 等 级 高 低 的 数量 关系 。 

在 顺序 其 表 中 , 既 无 相等 单位 .又 无 绝对 零点 ,数字 仅 表 示 等 级 或 位 次 先后 ,并 不 表 
示 某 种 属性 的 真正 量 或 绝对 值 ， 例 如 ,我 们 只 是 知道 了 在 100 米 短跑 比赛 中 李 平 获得 第 
一 名 . 王 红 获 得 第 二 名 ,由 此 我 们 知道 了 这 两 位 选手 的 排列 顺序 :但 促 竺 名 次 信息 并 不 车 
道 李 平 比 王 红 快 名 少 。 

3. 靳 丰 雷 起 [ interval scale ) 

当 规 定 了 相对 零点 和 相等 单位 后 ,对 事物 的 测量 就 可 做 到 更 为 精细 一 些 ; 不 侵 可 以 
获得 被 测量 对 象 在 这 一 属性 上 的 顺序 关系 .而 且 可 以 得 到 对 象 之 间 在 某 种 属性 上 的 差距 
有 名 少 个 单位 。 等 距 量 表 的 剂量 水 平 比 顺 序 上 看 表 更 商 , 其 结果 可 以 进行 加 , 减 返 算 及 差 
异 量 的 计算 。 但 由 于 没有 绝对 零点 ,并 不 能 测量 出 事物 届 性 的 绝对 量 , 得 到 的 数字 仍然 
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具有 相对 性 ,不 能 进行 乘 . 队 运算。 如 摄氏 温度 量 表 中 的 0TC 就 是 一 个 相对 零点 ,是 人 为 
地 将 水 的 冰点 温度 规定 为 0 , 它 并 不 是 没有 温度 之 意 。 因 为 该 量 表 具有 相等 单位 .所 以 
能 比较 不 同 诅 度 的 差异 量 , 即 相差 多 少 个 单位 。 

4 . 堆 比 量 囊 (rafio scale】 

千 比 量 表 是 具有 绝对 零点 和 相等 单位 的 量 表 , 其 对 事物 属性 的 测量 最 为 精细 ,量化 
水 平地 高。 等 比 量 表 是 参照 一 个 零点 来 确定 一 系列 类 ,而 且 这 里 的 霍 点 不 是 随意 规定 的 
一 个 位 置 , 它 是 一 个 意义 丰富 的 点 ,代表 被 测 变 量 的 总 对 缺 先 (完全 的 下 存在)。 存 在 一 
个 牲 对 的 . 非 随意 规定 的 零点 意味 着 我 们 可 以 测量 变量 的 忽 对 量 , 即 测量 其 离开 0 的 距 
离 ,这 就 使 得 按照 比例 关系 来 比较 不 同 的 测量 值 成 为 可 能 。 比方 说 ,一 个 人 解决 一 个 问 
题 罕 要 10 分 钟 ( 比 0 雪 10), 另 一 个 人 解决 这 个 问题 只 需要 5 分钟 ( 比 D 雪 5) ,那么 前 者 
花费 的 时 间 是 后 者 两 售 那 笃 多 。 有 了 等 比 量 表 ,我 们 和 不仅 能 够 比较 两 个 测量 值 的 差异 量 
和 差异 方向 ,而 且 也 可 以 接 照 比例 关系 对 两 个 测量 值 的 美 系 进行 描述 ,对 等 比 量 表 测 量 
得 到 的 早 果 可 以 进行 加 . 减 . 乘 . 除 运 算 。 

在 测量 中 ,事物 的 不 同属 性 往往 以 不 同 的 变量 来 标识 ,而 测量 的 结果 就 表示 为 变量 
值 。 为 后 续 表 述 的 方便 ,我 们 需要 先 来 对 心理 学 研究 中 的 变量 类 型 及 其 数值 类 型 进行 
分 析 。 


二 、 心 理学 研究 中 的 变量 了 


所 请 变量 (variable}) ,就 是 可 以 在 数量 或 性 质 上 发 生变 化 的 事物 的 属性 ,根据 其 来 
源 ,心理 学 研究 中 的 变量 可 以 分 为 三 类 : 刺 粕 变量 ,机体 变量 和 反应 变量 :根据 测量 结果 
的 数值 类 型 ,可 以 分 为 离散 变量 ,连续 变量 ;根据 研究 过 程 中 的 处 理 方式 ,可 以 分 为 自 变 
以 , 因 变 量 和 控制 变量 ， 


从 被 试 骨 庚 看 ,心理 学 研究 中 的 变量 包括 三 类 ;刺激 变量 (stimulus variable, 常 以 S 
表示 } .机体 变量 iorganism variabley 常 以 口 表 示 }) 和 反应 变量 人 {reaction wariabley re- 
sponse variable, 常 以 R 表示 )。 心 理学 的 研究 就 是 要 探 明 这 三 类 变量 间 的 相互 关系, 主 
要 是 相关 关系 和 因果 关系 。 因 此 现代 心理 学 研究 的 方程 式 可 以 写成 民 = 站 SO0) 它 表示 
人 的 心理 或 行为 改变 是 刺 汝 变量 与 机 位 变量 共同 作用 的 结果 。 

1. 币 幅 杰 督 

届 激 变量 是 来 自 外 部 环境 的 刺激 .所 以 也 可 叫 环 境 变 量 (enwifomrment wariablcy ,是 
研究 者 感 兴趣 或 注意 到 的 对 被 试 tparticipanter/subject) 心理 或 行为 可 能 产生 影响 的 外 
在 茶 忻 或 因素 ， 在 一 项 心理 学 的 研究 过 程 中 ,可 能 对 被 研发 生 影响 的 刺激 很 多 ,如 环境 
光线 , 声 啊 刺 激 ,人 际 变 互 等 ,心理 学 的 许多 研究 都 涉及 到 环境 因素 ,而 要 对 环境 因素 进 
行 测量 时 ,会 以 变量 来 标记 环境 属性 。 例 如 ,在 一 项 关于 家 庭 教 养 方 式 对 儿童 责任 意识 
下 责任 能 力 发 展 影 响 的 研究 中 ,父亲 或 母亲 等 监护 人 如 何 对 竺 孩子 的 过 错 . 良 好 行为 表 
现 ; 如 何 关 注 护 子 的 学 业 成 绩 ; 是 否 给 孩子 自主 选择 的 机 会 ;每 周 给 孩子 多 少 零 花 钱 ;每 
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天 人 允许 其 看 多 长 时 间 的 电视 节目 ;家 庭 成 员 之 间 的 人 际 英 系 等 ,都 是 被 调查 的 环境 因素 ， 
因此 也 就 可 以 成 为 研究 中 的 变量 。 还 比如 ,在 一 项 美 于 视觉 刺激 下 简单 反应 时 间 有 影响 因 
妙 的 研究 中 ,灯光 的 颜色 ,强度 ,面积 ;持续 时 间 以 及 环境 卓 音 . 主 试 者 特征 等 ,都 可 能 对 
被 试 的 反应 速度 发 生 有 影响, 是 刺激 变量 。 

2 . 规 蔡 蓄 硬 

在 心理 学 研究 中 ,那些 参与 到 研究 过 程 中 ,接受 观 训 的 对 象 叫做 被 试 Cparticipanty/ 
subject) ;而 主持 调试 过 程 的 人 叫做 主 试 Uexperirmenter) 。 机 栖 变 量 是 指 可 能 对 寝 试 的 心 
理 或 行为 发 生 影响 的 .被 试 自身 的 特征 或 身心 状态 。 如 被 试 年 龄 ,性 别 , 身 心 健康 术 平 、 
受 教育 程度 .特殊 训练 动机 ,性 格 , 内 驱 力 强度 等 ,都 有 是 常见 的 对 被 试 自己 的 某 种 反应 可 
能 产生 影响 的 变量 。 这 类 变量 虽然 是 研究 者 不 能 随意 操纵 的 ,但 研究 者 可 以 按照 实验 设 
计 的 要 求 主 动人 选择 机 体 变 量 的 水 平 并 将 其 作为 分 组 变量 。 如 研究 学 生 智 力 的 性 别 差异 ， 
认 知 策略 的 年 级 差异 .思维 风格 的 专业 差异 .心理 健康 水 平 对 学 生 学 业 成 绩 的 影响 等 等 。 

了 3, 上 友 应 变 雷 

反应 变量 是 指 研究 过 程 中 ,被 试 的 反应 或 内 外 变化 ,也 叫 因 变 基 (dependent varia- 
ble)。 反 应 变量 是 在 研究 中 需要 观测 和 记录 的 变量 ,通常 包括 反应 的 速度 .强度 .难度 . 准 
确 度 和 频数 .态度 偏向 等 。 如 不 同 光 照 条 件 下 的 反应 时 间 , 这 是 反应 速度 ,不 同 刺 激情 卉 
下 , 皮 电 测试 仪 指针 偏转 的 读数 ,这 是 反应 的 强度 ;智力 测验 中 ,完成 作业 的 难度 等 级 ,这 
是 反应 的 难度 ; 走 迷 富 实 验 中 ,完成 一 次 操作 走 入 育 韭 的 次 数 ,这 是 反应 的 淮 确 诬 ; 不 同 
教育 方式 下 ,学 生 利他 行为 的 次 数 , 这 是 反应 的 策 数 ,这些 变量 .都 是 易于 观测 和 记录 的 
变 基 ， 
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(二 ) 离散 变量 和 过 续 变 苦 

根据 测量 结果 的 数值 类 型 ,可 以 将 变量 分 为 离散 变量 (discrete variable) 和 连续 变量 
(eontinuous variable) 两 类 。 所 谓 离 散 变 量 , 其 可 能 的 取 值 都 是 相互 分 高 的 .间断 的 ,不 能 
连续 变化 。 换 名 话说 .将 所 有 可 能 的 数据 点 都 排列 出 来 ,得 到 的 是 不 能 连接 起 来 的 分 次 
的 点 。 这 样 的 变量 在 心理 学 研究 中 经 常 遇 到 ,如 学 生 上 学 迟到 的 次 数 .获得 "三 好 生 ” 称 
导 的 次 数 , 参 加 体育 比赛 的 各 次 .判断 题 做 对 老 洗 个 以 及 工大 完成 的 产品 件数 . 工 机 等 
级 . 瞻 人 金 等 级 等 ,这 些 变量 的 取 值 都 可 以 是 1.2.3………， :在 1 和 和 2 之 间 、2 和 3 之 间 都 没有 
可 能 的 其 他 取 值 。 

所 谓 连 续 变 量 , 其 可 能 的 取 值 是 可 以 连续 变化 的 。 或 者 说 ;在 任何 两 个 取 值 之 间 都 
还 包含 有 无 穷 包 个 可 能 的 取 值 。 如 果 将 所 有 可 能 的 取 值 都 列 出 来 ,这 些 取 值 点 就 连接 在 
了 一 起 ,所 以 叫做 连续 变量 。 比 如 ,长 庶 变 基 就 是 连续 变 基 ,在 1 米 和 2 米 之 间 还 有 无 穷 
多 种 的 长 诬 ， 

离散 变量 和 连续 变量 的 量 表 不 同 , 所 得 结果 的 性 质 和 不 同 , 能 能 适 用 的 计算 也 和 相同 ， 
比如 ,1 米 和 2 米 , 这 是 使 用 等 比 量 表 测 基 得 到 的 连续 变 和 量 值 , 可 以 相 加 再 平均 得 到 15 | 
米 ; 但 是 第 1 名 和 第 2 名 是 顺序 量 表 测量 得 到 的 等 级 变量 值 ,不 能 相 加 后 平均 得 到 “第 
1.5 各 ”。 因 为 1.5 米 是 长 度 变量 的 一 个 可 能 值 , 但 在 名 次 的 等 级 其 表 上 不 存在 “第 1.5 
名 "的 可 能 取 值 。 当 然 , 在 有 些 情况 下 还 是 可 以 粗略 地 将 一 些 运 算 运 用 到 离散 变 基 中 ， 
比如 在 对 赤 . 橙 . 黄 . 绿 . 青 、 蓝 、 紫 七 种 颜色 进行 喜好 度 的 评价 时 ,小 王将 红色 排 在 最 辟 爱 
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的 等 级 7, 小 李 特 红色 排 在 中 等 喜爱 诬 的 等 级 4。 如 果 将 两 个 人 对 红色 的 喜爱 诬 平 均 , 则 
得 到 5. 5。 严 格 地 说 :这 种 运算 是 不 合适 的 ,因为 这 一 测量 中 本 身 就 设 有 5.5 的 等 级 ,而 
采用 这 种 运算 也 是 为 了 描述 这 西 个 人 对 红色 襄 好 度 的 总 体 情 况 , 或 者 说 :在 做 这 种 运算 
时 ,我 们 已 既 把 等 级 评定 粗略 地 看 作 是 等 距 量 表 了 。. 


(三 ) 自 变 其 . 因 变 基 与 控制 变量 

在 心理 党 研究 中 ,研究 者 带 澡 面临 两 类 课题 ;一 类 课题 是 要 探 明 人 人 的 心理 活动 有 是否 
受到 某 一 种 或 某 一 些 因素 的 影响 , 即 心 理 活 动 过 程 中 的 因果 关系 。 研 究 者 要 有 意 地 改变 
或 选择 不 同 条 件 , 然 后 对 被 试 的 一 些 行为 指标 或 心理 活动 进行 测量 ,以 便 确 定 这 些 行为 
或 心理 因素 是 否 随 着 条 件 的 改变 而 变化 。 如 果 因 为 研究 者 操纵 改 变 的 条 件 引 起 了 被 试 
打 些 行为 和 心理 指标 的 变化 , 则 这 些 变 量 之 间 可 能 存在 因果 美 系 或 相 半 关系。 但 是 ,这 
里 入 往往 需要 注意 控制 一 些 其 他 因素 ,以 避免 这 些 因 素 的 变化 所 造成 的 混淆 。 比 如 ,为 
了 探 明 奖金 发 放 方 式 是 理会 影响 职员 的 工作 绩效 ,研究 者 选择 了 两 个 工 组 分 别 采 用 两 种 
不 同 的 奖金 发 旅 方式: 在 其 中 一 个 工 组 每 月 发 放 一 寥 兹 金 : 在 另 一 个 工 组 半年 发 放 一 次 
奖金 。 实 验 央 期 为 一 年 ,一 年 结束 时 比较 两 个 工 组 完成 的 工作 绩效 。 如 果 观 察 到 了 两 个 
组 工作 绩效 有 明显 差异 , 则 说 明 奖 金 的 发 放 方式 很 可 能 影响 到 了 员工 的 工作 积极 性 。 在 
这 一 研究 中 ,要 想得到 相对 可 靠 的 结论 .就 要 在 两 组 间 进 行 实验 条 件 的 控制 , 即 除 了 发 放 
奖金 方式 的 不 同 外 ,其 他 因素 在 两 个 组 中 应 该 基本 一 致 ,如 车 间 的 通风 葵 件 ,昭明 条 件 、 
气温 茶 件 ,员工 受 教育 程度 ,从 事 相 应 工作 的 年 上限, 年 龄 和 性 别 比 例 在 两 个 工 组 间 是 平衡 
的 。 这 个 例子 中 ,有 一 些 变量 是 研究 者 感 兴趣 的 , 拟 考察 其 是 理 对 被 试 的 心理 或 行为 改 
变 发 生 了 影响 ,这 些 变量 叫 自 变量 (findependent variable) ;为 了 有 效 地 测量 出 被 试 的 心理 
或 行为 是 否 随 着 目 变 其 的 改变 而 变化 ,要 进行 测量 和 记录 的 变量 叫做 国 变量 (dependent 
variabley。 除 自 变量 和 国 变量 外 ,还 有 许多 要 进行 控制 的 变量 ,这 些 变量 就 叫 额外 变量 
(extra variable) 或 控制 变量 (control variable)。 就 上 面 这 个 例子 来 说 ,奖金 监 放 方 式 星 
自 变 量 ; 工 作业 绩 是 国 变量 ,而 所 有 其 他 一 些 要 在 两 个 工 组 间 保 持 相 等 或 平衡 的 国 素 , 就 
是 控制 变量 或 额外 变量 . 

心理 学 研究 的 改 一 类 课题 , 则 是 探索 变量 间 的 相关 关系 ,或 者 说 是 共 变 关系 , 即 两 个 
变量 在 数值 变化 上 是 否 存 在 关联 性 。 如 我 们 抽取 某 一 班级 同学 的 数学 .物理 两 门 巢 程 的 
考试 成 绩 ,将 两 门 课程 成 绩 排名 进行 对 照 后 发 现 : 如 果 一 同学 的 数学 成 绩 比 较 好 ,他 的 物 
理 成 顷 也 可 能 比较 好 :反之 ,数学 成 绩 比 较 差 则 物理 成 绩 也 可 能 比较 善 ,两 门 课程 成 绩 具 
有 录 种 程度 上 一 致 性 的 变化 关系 。 于 是 .不 难 想象 ,利用 数学 成 绩 可 在 一 定 程度 上 预测 
物理 成 绩 ， 这 时 ,也 可 以 把 数学 成 绩 叫 自 变 量 ; 物 理 成 绩 叫 做 因 变 量 ;, 其 他 诸如 年 龄 ,年 
级 .教育 环境 等 因素 也 属于 控制 变量 . 即 要 想 观察 数学 与 物理 是 理 具 有 一 致 的 变化 关系 。 
需要 将 年 龄 .年 级 .教育 环境 等 控制 在 同一 个 水 平 上 ， 


三 、 测 量 中 的 系统 误差 与 随机 误差 


前 文 已 经 指出 ,任何 事物 的 变化 都 具有 一 定 的 随机 性 ,科学 测量 也 具有 随机 性 ， 测 
攻 结 果 表 现 出 某 种 不 确定 的 波动 ,这 种 波动 中 包含 着 一 定 的 误差 波动 。 换 名 话 来 说 , 任 
何 油 量 都 存在 可 能 的 侦 差 ,这 种 偏差 也 表现 出 确定 性 和 不 确定 性 两 个 方面 。 比 如 说 ,给 
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某 位 驾校 学 员 测 量 反 庶 时 间 , 可 以 通过 心理 学 实验 室 中 的 简单 反应 时 间 测 试 仪 来 完成 ， 
要 求 被 试看 着 测试 仪 上 的 一 个 圆 形 窗口 :把 食指 放 在 一 个 按钮 上 做 好 按键 准备 :主持 测 
试 的 大 喊 “ 预 备 ”, 随 后 灯泡 点 亮 ; 被 试 一 看 到 灯泡 亮 就 尽快 按键 ;测试 仪 就 记录 下 从 灯泡 
膏 到 被 试 按 下 键 之 间 的 时 间 间 看 ,这 就 是 视觉 刺激 的 简单 反应 时 间 。 此 过 程 重复 进行 很 
多 次 ,你 会 发 现 , 测 试 结果 具有 一 定 的 波动 性 ,下 列 数据 就 是 笔者 为 一 学 生 测 试 20 次 的 
结果 (单位 :ms); 
200 165 189 230 212 190 145 220 :210 195 
]73 190 -168 1180 206 260 230 1886 207 217 

这 一 测试 结果 椒 在 不 断 的 变化 中 ;其 中 必然 存在 一 些 稳定 的 或 不 稳定 的 因素 ,这 些 
因素 禾 成 了 每 一 侈 测量 和 欧 果 都 可 能 侦 离 被 试 本 来 的 反应 时 间 , 该 偏差 就 叫做 误差 1er- 
ror)。 统 计 学 的 思维 量具 有 因果 取向 的 ,所 以 在 这 里 就 会 说 ,误差 总 是 有 原 国 的， 在 灵 允 
的 测量 案例 中 ,要 分 析 误 差 的 原因 ,也 就 是 误差 源 , 你 会 发 现 有 两 类 :一 类 是 具有 确定 性 
的 误 考 源 , 它 造成 的 测量 偏差 具有 基 种 确定 性 。 比 如 说 ,反应 时 间 测 试 仪 对 接 键 反应 的 
啊 应 有 20ms 的 滞后 , 它 就 会 造成 一 个 恒定 的 20ms 误差 , 即 每 一 次 测量 都 金吉 出 这 
20ms, 它 使 得 每 一 次 测量 的 结果 都 比 被 试 的 实际 反应 时 间 才 出 来 20ms, 这 种 误差 来 源 于 
测试 系统 本 身 , 所 以 叫做 系统 误差 (system errorl ,也 叫 全 常 误 (eeonmstanmt error)。 队 非 对 
测试 系统 本 身 进行 检测 ,或 者 将 一 个 系统 测试 的 结果 与 同类 的 其 他 系统 测试 结果 进行 比 
较 , 理 则 系统 误差 是 很 难 被 发 现 的 。 

还 有 一 些 国 素 处 在 不 断 变化 中 。 这 种 变化 本 身上 有 具 有 随机 性 ,所 以 对 测试 结果 的 影响 
也 具有 随机 性 , 即 造成 的 测试 俩 差 幅 度 , 俩 莽 方 向 都 具有 布 确定 性 :有 时 是 正 误差 ,有 时 
是 负 误 其 ;有 时 是 较 太 的 误差 ,有 时 是 较 小 的 误差. 此 类 随机 性 的 误差 就 叫做 随机 误差 
trandom error) ,在 很 包 次 的 重复 测量 中 ,随机 误 盖 造成 数据 在 一 定 范围 内 上 下 随机 波 
动 。 如 果 将 重复 很 儿 次 测量 的 结果 相 加 平均 , 正 负 误差 相互 抵消 而 接近 于 0, 所 以 重复 测 
最 的 平均 值 就 能 接近 于 直 值 ,随机 误差 为 下 时 的 测量 值 就 是 测量 的 真 值 .也 叫 真 分数 ， 

在 心理 学 研究 中 ,测量 结果 的 变化 分 别 受 到 系统 因素 和 随机 国 束 的 影响 。 而 统计 学 
就 是 帮助 我 们 在 这 些 变化 中 将 随机 误差 与 系统 误差 分 离 , 发 现 具有 一 定 确 定性 的 系统 变 
化 。 如 :为 了 研 窒 个 体 在 声 , 光 刺激 通道 下 反应 速度 的 莽 异 性 ,就 可 以 分 别 在 两 种 亲人 忻 下 
测 基 得 到 两 个 数据 样本 ,然后 外 别 计 算出 数据 变化 中 的 随机 变化 和 系统 变化 。 系 统 变 化 
是 由 于 刺激 通 庆 不同 引起 的 :随机 变化 是 其 他 偶然 因素 引起 的 。 如果 声 光 刺 激 变 化 引起 
的 反应 时 间 的 系统 变化 明显 大 于 随机 误差 量 , 我 们 就 可 以 说 人 们 在 声 光 不 同 刺激 条 件 下 
的 反应 速度 明显 不 同 。 


第 三 节 量化 研究 的 逻辑 :从 样本 到 总 体 


心理 学 研究 存在 两 种 截然 不 同 的 传统 , 即 定 量 研究 (quantitative research) 和 定性 研 
守 Cogualitative researchhs 订 者 也 叫 实 证 主 总 5positivismy 策 窜 , 蛋 于 形 而 下 :后 者 也 叫 后 
实证 主 多 (post-positivismy 人 研究 , 偏 于 形 而 上 。 两 种 研究 取向 所 持 的 方法 论 思 想 有 很 大 
不 同 , 研 究 假 设 ,研究 目标 也 和 三 同 ,但 并 无 就 轻 就 重 . 熟 优 熟 劣 之 分 。 采 用 统计 学 ,就 是 出 
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于 量化 研究 的 需要 。 那 各 心理 学 研究 为 什么 需 要 量化 研究 呢 ? 量化 研究 的 基本 假设 是 
什么? 

一 、 量 化 研究 的 基本 假设 

顾名思义 ,定量 研究 少不了 数据 ;数据 来 自 于 测量 ;而 测量 的 直接 对 象 ,往往 是 可 观 
察 的 现象 。 所 以 ,在 不 少 研 究 者 看 来 ,心理 学 领域 中 的 定量 研究 ,在 相当 程 谍 上 沦 为 对 人 
的 外 部 行为 进行 观 抽 ,是 行 浮 主 义 的 。 定 量 研 究 的 基本 人 恨 设 是 :社会 环境 特征 构成 了 屯 
六 存在 的 现实 ,而且 这 些 特定 具有 相对 时 间 和 情境 而 言 的 不 变性 。 实 证 主义 研究 人 员 异 
以 发 展 知识 的 力量 是 :收集 样本 中 可 以 观察 到 的 行为 方面 的 宽 料 ,并 运用 数 掌 方法 来 分 
析 这 些 资 料 ."J 具 体 而 言 ,定量 研究 存 在 以 下 假设 或 特点 : 

(一 ) 对 研究 对 象 的 认识 

在 心理 学 领域 . 定量 研究 的 实证 取向 , 首先 表现 为 把 心理 现象 看 成 是 一 个 客观 的 社 
会 现实 。 心 理学 研究 基 主 观 对 客观 的 反 映 过 程 , 所 以 这 里 首先 存在 一 个 主 , 客观 的 分 
离 。 这 种 分 高 导致 对 研究 者 理性 的 . 函 盾 性 的 认可 即 一 方面 系 认 人 的 认识 力 ， 强调 客 
现 现实 是 可 知 的 ; 男 一 方面 取 表 现 出 对 人 类 理性 的 不 信任 性 ,看 到 理性 的 弱点 。 所 以 , 引 
大 消 种 观察 的 技术 .资料 人 益 析 的 技术 ,监督 的 机 制 来 制约 人 的 理性 不 足 。 从 认识 论 的 层 
面 看 , 定 其 研究 取向 持 以 下 基本 观点 呈 : 

1) 存在 着 客观 的 社会 现实 , 即 对 于 研究 者 来 说 ,心理 现 章 也 是 一 种 窒 观 存在 ,是 可 
以 加 以 研究 和 认识 的 。 

‘2) 假定 社会 现实 在 时 空 方 面具 有 相对 的 不 变性 , 即 心理 现 户 的 发 生 , 发 展 和 变化 
具有 内 在 的 规律 性 或 确定 性 ,这 就 是 研究 者 企图 去 寻找 的 真理 。 

(3) 从 机 械 论 的 前 度 来 看 矢 社 会 现象 之 间 的 因果 关系 。 心 理 现象 的 规律 具有 不 变 
性 ,表现 为 变量 之 间 的 相互 制 芍 关系 ,在 这 些 制 芍 中 也 包 会 因果 甘 系 ,这 构成 了 心理 实验 
的 理论 基础 。 

(4) 对 研究 被 试 及 其 所 处 情境 采取 客观 而 不 忱 不 情 的 态度 。 茎 然 是 基于 现实 的 研 
究 ,研究 者 在 对 心理 现象 进行 研究 的 时 候 , 就 应 站 在 理性 的 .公正 而 中 立 的 立场 , 居 量 性 
饱 研 究 竺 论 的 个 做 化。 








(二 ) 研究 对 堆 的 可 撞 作 化 

简化 或 操作 化 往往 是 定量 研究 所 必须 采用 的 方法 ,因为 许多 人 研究 对 外 都 是 雪 杰 量 相 
下 作用 的 复杂 系统 。 毫 无 疑问 ,心理 活动 更 是 一 个 巨 系统 ,要 想 探 明 其 中 的 各 种 规律 和 
机 制 ,也 必须 进行 研究 对 象 的 操作 化 , 即 让 研究 情境 简单 化 .虚拟 化 和 可 测 生 化。 和 否则， 
定量 研究 就 会 充满 混乱 而 变 得 不 可 行 。 研究 中 茹 贡 采 用 的 方法 是 : 

(1) 研究 个 体 或 代表 性 样本 。 研 究 总 是 或 只 能 针对 少数 个 案 来 进行 ,但 是 在 作出 研 
帘 靖 论 的 时 候 , 研 究 者 总 想得到 普 适 性 的 “真理 ". 这 是 研究 者 带 见 的 价值 商 估 人 慑 癌 , 可 
以 理解 ， 但 是 借助 于 样本 的 研究 甸 会 存在 抽样 偏差 和 测量 的 随机 误差 ,所 以 在 依据 样本 


别 [ 匡 ] 梅 雷 迪 斯 . D 商 尔 等 著 , 许 庆 隐 等 译 避 教育 研究 方法 导论 六 江 苏 玫 育 出 版 杜 , 2007 年 古 , 第 :27 一 2 页 。 
寻 [和 鞭 ] 梅 雷 册 央 : 吕 商 尔 等 著 , 许 庆 王 等 主 民 救 育 研 帘 方 千 导 褒 ? 讶 荔 教 育 山 版 杜 :2n007 年 策 * 第 27 页， 


的 形成 结论 时 ,必须 估计 误差 因素 ,特别 是 随机 误差 的 影响 ,这 就 是 统计 党 手段 的 作用 。 

(2) 研究 行为 和 其 他 可 以 观察 的 现象 。 采 用 基 化 研究 或 实证 研究 ,包括 心理 学 . 社 
僚 学 等 ,研究 者 所 苇 取 的 主要 是 短 试 的 行为 资料 .可 通过 观 紧 获取 的 实 料 .然后 进行 理论 
推断 。 

(3) 研究 自然 环境 中 或 虚拟 环境 中 人 的 行为 。 研 究 中 ,资料 可 来 自 于 对 自然 情境 中 
大 的 行为 的 直接 观测 ,也 可 以 来 自 于 对 虚构 情境 中 人 的 反应 的 记录 等 。 比 如 科 尔 伯 格 研 
穹 儿童 道德 判断 发 展 过 程 所 使 用 的 就 是 讲 构 的 情境 。 此 外 ,还 可 以 是 研究 者 有 意 世 该 的 
情境 ,这 多 半 属 于 实验 的 方法 。 

(4) 把 现实 作为 变量 来 分 析 。 研 究 过 程 往往 是 经 过 设计 的 , 即 先 编制 研究 方案 , 然 
后 有 计划 地 实施 。 而 研究 设计 离 不 开 变 量 分 析 , 因 为 在 将 研究 的 社会 现实 分 解 为 不 同事 
物 属 性 后 ;我们 看 到 了 榴 才 相互 变 灵 的 变量 ,所 以 研究 设计 往往 是 从 变量 分 析 开 始 的 。 

(5) 根据 预先 定义 的 概念 和 理论 来 确定 应 该 收集 哪些 资料 。 研 究 往 往 基 基于 研究 
假设 进行 ,所 以 研究 中 首先 要 获取 的 就 是 有 利于 检验 假设 的 那些 资料 。 这 有 时 也 会 导致 
错误 ,因为 研究 者 的 个 人 信念 或 个 见 会 影响 观测 资料 的 选择 ， 


(三 ) 研究 过 程 的 技术 化 

把 心理 活动 看 作 是 随机 现象 的 时 候 , 统 计 学 就 成 为 心理 学 研究 的 重要 技术 手段 了 . 
心理 学 也 因此 更 具有 科学 特征 .心理 学 量化 研究 的 技术 ， 

(1) 产生 表达 现实 的 数字 质料 。 基 化 研究 的 重要 手段 就 是 对 研究 质料 进行 定量 分 
析 ,所 以 会 尽 可 能 地 将 研究 资料 数量 化 :形成 等 级 的 .等 距 的 .等 比 的 数字 系列 。 

(2) 运用 统计 学 的 推断 程序 ,从 某 一 样本 的 研究 结果 推 及 一 个 界定 明确 的 总 体 , 慕 
得 一 般 结 论 。 

(3) 撰写 不 受 个 人 情感 影响 的 ,客观 公正 的 研究 报告 。 实 证 研究 报告 要 保证 呈现 资 
料 的 销 晰 性 ,客观 性 .信息 的 易 著 取 性 ,具有 固定 的 所 与 格式 和 要 求 。 有 些 研究 者 视 之 为 
令 人 生 压 的 "八股 文 "。 环 不 知 , 大 恶 源 自 一 种 立场 ,有 时 是 一 种 偏见 。 


二 、 总 体 、 样 本 与 个 案 
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心理 学 研究 中 的 测量 常常 是 针对 个 案 进 行 的 ,测量 的 许多 个 案板 成 样本 ,而 样本 如 ， 


果 是 届 于 某 一 总 体 的 代表 性 样本 时 ,其 特征 能 够 在 很 太 程 度 上 扩 里 总 体 特征 。 这 里 ,对 
三 个 慨 优 及 上 其 关系 做 适当 说 明 ，。 

总 体 (population) 是 指 具 有 某 一 特 福 的 一 类 事物 或 大 的 全 体 。 简单 地 说 , 它 是 包 舍 
菜 一 研究 课题 涉及 的 所 有 可 能 的 研究 对 象 。 就 不 同 的 课题 来 说 ;总 体 太 小 会 有 很 大 不 
同 。 构 成 总 体 的 个 体 友 名 是 指 人 人 或 物 , 心 理学 研究 中 ,个 体 也 可 指 心 寻 活 动 ,例如 思维 能 
力 、 和 学习 绩 瞳 .反应 时 间 和 等。 总 体 的 性 质 是 由 个 体 的 性 古 决定 的 ,所 以 理论 上 讲 . 要 丁 人 解 
总 体 就 要 对 每 一 个 体 进行 观测 ,这 实际 上 做 不 到 ,研究 者 一 般 是 对 总 体 中 的 部 分 个 体 进 
行 观测 ,这 些 部 分 个 体 组 成 样本 。 

样本 (tsample) 是 按 一 定 规则 从 总 体 中 抽取 出 来 的 部 分 个 体 组 成 的 集合 ,该 集 全 中 的 
个 体 数 叫做 样本 容量 ,一 般 用 表示。 样本 对 总 体 应 具有 很 好 的 代表 性 ,才能 保证 推论 
的 正确 。 一 位 责 深 的 统计 学 家 和 曾 说 过 ,数据 有 了 两 种 :好 数据 和 坏 数 据 ， 好 数据 是 根据 侣 
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理 ,正确 的 统计 学 原理 搜 储 到 的 数据 : 坯 数 据 是 通过 刻意 的 或 不 合理 的 方法 搜 集 到 的 数 
据 ， 我 们 可 以 通过 下 面 两 人 的 对 话 ; 发 现 搜集 数据 中 存在 的 问题 ~"“。 在 一 个 办 公 室 里 ,一 
个 男 职 员 和 一 个 去 职员 就 一 项 关于 “什么 是 男人 人 最 重要 的 事情 "的 调查 结果 在 讨论 。 埃 
十 说 :“ 根 据 这 个 调查 ,63 的 男人 把 家 庭 放 在 事业 ,金钱 其 至 是 朋友 的 前 面 "。 男 土管 
道 ;“ 那 也 许 是 真 的 .但 是 你 些 沽 知道 调 查 是 直译 一 国事. 而 且 还 司 贷 本 解 它 所 用 的 三 法 ， 
然后 才能 相依 它们。 比如 说, 当 补 调查 者 在 答题 时 ,他 们 的 妻子 是 天 在 身边 ”。 毫 无 疑 
问 ,任何 调查 数据 的 获取 都 有 当时 的 情境 。 情 卉 和 不 同 , 朱 果 可 能 也 是 和 不同 的 。 这 就 需要 
研究 者 作出 选择 或 判断 , 旧 样 的 情境 下 ,和 闭 果 更 为 可 千 ， 上述 例 子 中 的 被 调查 者 在 管 题 
时 ,如果 他 们 的 妻子 不 在 身边 ,很 可 能 就 会 是 另外 一 个 关 果 。 数据 的 搜集 受 很 多 因 素 的 
影响 ,一 般 在 搜集 数据 之 前 都 要 进行 充分 地 思考 和 设计 ,使 得 数据 搜集 的 方法 和 过 程 全 
理 有 效 。 

枸 成 总 体 或 样本 的 每 一 个 基本 单元 称 交 个 案 tcase)。 例 如 :我 们 调查 女性 消费 者 对 
化 妆 品 品牌 的 偏爱 程度 ,那么 拇 一 女性 消费 者 就 是 一 个 个 案 ; 要 在 一 所 高 中 研究 学 生 学 
习 策 略 的 使 用 情况 ,那么 这 所 学 校 中 的 每 一 位 高 中 生 就 是 一 个 个 案 。 

每 一 项 研究 都 是 一 个 独立 事件 ,多 数 情况 下 是 对 一 个 或 多 个 样本 进行 观测 .但 大 部 
分 研究 试图 要 解 管 的 都 是 关于 较 友 群体 的 一 般 问题 ,而 不 是 关于 较 小 群体 的 ,少数 特定 
大 的 问题 。 因 此 ,研究 者 一 般 都 期 望 将 他 们 的 研究 结论 推广 到 研究 被 试 之 外 的 范围 。 这 
其 中 存在 一 对 矛盾 :一 方面 要 选取 较 少 被 试 参加 实验 # 另 一 方面 又 期 望 将 结论 推广 到 一 
个 天 的 群体 ,这 一 子 盾 如 何 解决 呢 ? 

为 使 研究 结果 能 被 推广 到 总 体 ,选取 的 样本 就 要 具有 民 表 性 , 即 形成 代表 性 样本 
Crepresentative sample)。 所 谓 代 表 性 样本 ,就 是 在 与 研究 有 关 的 特征 方面 ,样本 与 总 体 
基本 一 致 [ 误 其 在 允许 范围 内 )。 相 反 , 如 果 样 本 特征 与 总 体 特 征 相 差 共 远 ,超出 了 谋 凌 
许可 的 范围 ,这 样 的 样本 就 叫 敌 有 偏 样本 。 在 被 试 选 择 中 , 尽 基 得 到 代表 性 样本 ,以免 有 
坊 样本 的 出 现 。 

需要 指出 的 是 ,不 管 膝 取 何 种 方法 ,从 一 个 总 体 中 抽取 样本 ,误差 总 是 存在 的 。 所 以 
样本 特征 与 总 体 特 征 必 然 存在 差异 ,而且 这 种 差异 符 侣 统计 学 规律 一 一 即 如 果 进 行 许多 
众 抽样 ,抽样 的 误 间 分 布 往往 符合 某 种 统计 学 分 布 规律 .因此 :所 背 代表 性 幸村 是 指 在 
统计 学 意义 上 该 样本 能 代表 总 体 。 那么 如 何 进行 被 试 选 取 , 才 能 保证 得 到 代表 性 样本 
呢 ? 在 行为 科学 研究 中 ,样本 选取 的 方法 包括 概率 抽样 (probability sampling》 和 非 则 率 
抽样 Cnonprobability sampling} 两 去 类 。 其 中 概率 抽样 主要 包括 简单 随机 抽样 ,分 屋 随机 
抽样 , 按 比 例 分 层 随机 抽样 , 整 群 抽样 : 非 概率 抽样 主要 是 便利 抽样 ” . 

1 , 苘 童 感 胡 荐 莅 

简单 随机 抽样 isimple random sampling}) 的 基本 要 求 量 :总 体 中 的 每 一 个 体 有 具有 相等 
且 独 立 的 被 抽 中 概率 。 概 率 相 等 意味 着 任何 个 体 都 不 比 其 他 个 体 更 有 可 能 被 选中 ;相互 
她 立 则 意味 着 某 一 个 体 的 被 选择 不 会 影响 对 男 一 个 体 的 选择 。 简 单 随机 抽样 的 过 程 一 


， 般 包括 三 步 ， 


而 ”车 家 生 , 王 爱 平 下 大 六 心理 与 杜 会 研究 统计 方法 3,. 北 京师 藏 太 学 出 版 社 :2005 年 股 , 第 43 页， 
号 则 链 必 记 用 实验 心理 党), 上 诲 教育 出 版 杜 ,2006 年 版 ,第 48 一 别 更 。 


步骤 1: 确 定 一 个 总 体 ; 即 你 预备 从 中 选取 样本 的 总 体 ， 

步 红 2; 列 出 总 体 中 的 所 有 成 员 , 形 成 个 体 表 列 .通常 对 表 列 中 的 所 有 个 体 网 号 ， 

步骤 3: 根据 研究 需要 ,使 用 随机 过 程 从 表 列 中 选择 出 一 定 丈量 的 个 体 。 这 里 所 讲 的 
抽签 法 " ,也 可 以 是 “随机 数 表 法 "等 。 

抽 整 法 ,是 先 将 总 体 中 的 每 一 个 体 编 号 ,并 把 每 一 下 全 上 柚 写 在 一 张 纸 荣 上 +#+ 和 再 将 
纸 条 接 成 团 ,混在 一 起 并 播 匀 + 最 后 随机 检 出 若干 纸 团 ,这 些 纸 团 上 的 编号 就 是 征 选 取 的 
被 试 的 编导 ， 

“随机 数 表 "是 由 0 一 9 的 数字 随机 排列 构成 的 数码 表 , 如 附 表 1 所 示 。 它 以 5 个 数字 
为 一 组 ,如 图 1-1 所 示 就 是 随机 数 表 的 一 个 小 片段 ， “ 拒 计 学 ?或 "心理 方法 学 "的 教材 一 
股 都 会 特 * 随 机 数 表 "作为 附录 。 随 机 数 表 法 的 操作 程序 是 : 先 将 被 试 编号 :然后 随机 地 
从 * 随 机 数 表 * 中 划 出 一 个 数 表 片 段 , 从 该 片段 的 开始 部 分 依次 向 后 或 向 下 搜索 : 当 过 到 
一 姐 数 字 的 后 边 几 位 正好 与 某 一 个 体 的 编号 相同 时 ,就 将 该 个 体 作为 被 试 选 出 ; 依 此 方 
法 继续 进行 ,直到 选 够 所 需要 的 被 试 数 为 止 。 比 如 ,要 想 从 100 大 的 总 体 中 抽取 - -20 
大 的 样 林 。 可 以 先 特 这 100 名 个 体 编 成 00 一 99 号 ;然后 从 数 表 中 随机 选择 一 个 片段 ,如 
图 1-1 中 第 5 到 第 7 行 .第 1 到 第 7 栏 ;接着 按 顺 序 选 号 。 这 里 选 到 的 编号 是 :12、18， 
55.70.51.41.82 .42.81.39.72.97.47.61.59.16、.23.09.99.40, 构 成 一 个 20 人 的 样本 。 

ql57 4859 O837 25993 T6249 T0886 5730 J674 
05545 S5043 10537 43508 90611| 683744 10967 21343 
IaB11 60X50 了 2404 36223 S50051 00327? i543 MOI4 
4976 T4951 QA4051 T5853 TABO05 0194 32478 Ti6G95 
7312 GITIB 99755 30870 34251 25841 548682 10514 
i742 Go da4339 30477 321797 33118 P2647 O06H50 
43361 28859 11016 45623 93009 00499 43640 74036 
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49540 13181 O8429 84187 69538 29661 77738 09527 
67698 72633 37948 21569 41959 68670 45214 83880 
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图 1-1 随机 数 表 的 盯 掉 


简单 随机 抽样 从 理论 或 还 辑 上 排除 了 选择 偏好 ,一 般 可 以 得 到 代表 人 性 样本 。 但 是 ， 
需要 注 意 的 是， 简单 随机 抽样 是 通过 把 每 次 的 选 反 都 全 于 陆 视 杜 的 夫 风 之 F 来 请 除 偏 
好 的 , 它 可 以 在 较 长 的 抽样 过 程 中 得 到 和 银 好 的 代表 性 样本 ,就 如 投 撕 儿 千 次 磺 币 ;最 后 的 
结果 会 是 正面 朝 上 和 反面 朝 上 各 约 占 50 饭 。 但 如 果 抽 样 过 程 较 短 ,就 可 能 得 到 有 严重 偏 
向 的 样本 ,就 像 投 据 一 种 质地 均匀 的 硬币 10 次 ,截至 会 出 现 10 次 都 是 正面 贿 上 的 缚 来; 
从 100 名 女生 和 100 各 男生 组 成 的 总 体 中 随机 机 选 10 大 ,甚至 会 出 现 抽取 的 10 人 全 为 
明生 或 全 为 女生 的 情况 。 为 了 避免 出 再 这 种 非 代表 性 样本 ,研究 者 可 以 对 用 分 层 随机 机 
样 和 按 比 例 分 层 随机 抽样 的 方法 。 

2. 办 层 和 藤 此 全 分 层 刚 规 粒 检 

多 数 情 况 下 ,一 个 总 体 可 以 区 分 出 各 种 不 同 的 于 群 (subgroup)。 -所 大 学 里 的 学 
生 可 以 委 为 不 同年 缀 .不同 专业 ,不 同性 别 的 子 群 等 村 ， ajo 各 子 群 都 
能 得 到 代表 .可 以 合用 分 屋 随 机 抽样 Cstratified random sampling) 方 法 ;首先 确认 样本 中 
应 包括 哪些 具体 的 子 群 或 屋 ;然后 使 用 与 简单 随机 抽样 完全 一 样 的 步 双 ,从 每 个 预先 确 
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兴 的 于 群 中 选择 数 基 太 致 相等 的 于 群 随机 样本 ;最 后 把 这 些 子 群 样本 合并 成 一 个 较 大 的 
样本 。 比 如 计划 从 某 学 院 的 研究 生 中 抽取 50 人 的 样 率 ; 可 以 首先 从 男生 中 随机 抽取 一 
25 人 的 样本 ,再 从 女生 中 随机 抽取 一 25 入 的 样本 ,最 后 将 这 两 个 子 群 样本 澡 并 起 来 ,就 
构成 了 想 要 的 分 层 随机 样本 。 

当 人 研究 者 想 对 总 体 中 的 各 个 部 分 进行 描述 或 比较 时 ,分 层 随机 抽样 方 法 就 显得 特别 
有 用 了 。 采 用 这 种 方法 ,样本 中 的 每 一 子 群 总 须 包含 足 静 的 个 体 以 便 它 能 代表 总 体 中 与 
其 对 应 的 部 分 。 

当 人 赋 究 焦点 集中 到 总 体 中 的 某 一 特定 子 群 时 ,最 好 采用 分 层 随机 抽样 方法 来 选择 被 
试 。 也 就 是 说 , 当 研 究 要 考察 各 具体 子 知 并 对 他 们 进行 比较 时 .这 种 方法 是 比较 适当 的 ， 
但 如 果 研 究 的 目标 是 考察 整个 总 体 , 这 种 抽样 技术 可 能 会 带 来 问题 。 最 典型 的 情形 是 ， 
总 体 中 每 个 子 群 的 实际 人 数 不 相 等 ,但 样本 中 各 子 群 的 代表 人 数 都 相等 。 比 如 说 ,在 一 
个 总 体 中 某 一 子 群 的 大 数 只 占 总 体 的 3 纺 ,但 它 在 样本 中 却 占 到 了 25 贤 的 人 分量。 克服 这 
一 辣 题 的 方法 是 采用 接 比 例 分 层 随机 抽样 ,做 法 是 :首先 区 分 出 总 体 中 的 各 个 子 群 或 层 ， 
并 确定 总 体 中 相应 子 群 所 占 的 比例 ;然后 根据 计划 的 样本 容量 和 各 子 群 在 总 体 中 的 比例 
数 确 定 每 一 子 群 应 抽取 的 被 试 数 ; 最 后 从 每 一 子 群 中 抽取 相应 的 被 试 数 ,各 并 在 一 起 ,就 
可 以 得 到 一 个 其 比例 甘 系 与 总 体 中 的 比例 关系 完全 匹配 的 样本 。 这 种 抽样 就 叫做 按 比 
例 分 屋 随 机 抽样 tporportionate stratilied random sampling}. 或 简称 为 比重 随机 抽样 
tporportionate random sampling)} . 

3. 整 群 丙 样 

研 帘 者 通常 都 是 从 总 体 中 选择 单个 的 个 体 而 得 到 样本 ,但 有 时 个 体 是 以 现成 整 群 形 
武 存 在 :所 忆 研 究 者 可 以 随机 地 选择 整 组 。 比 如 研究 者 想 从 某 个 城市 的 学 校 中 抽取 一 个 
由 300 多 名 初中 二 年 级 学 生 组 成 的 样本 ,他 不 是 一 次 选择 一 个 学 生 , 而 是 随机 地 选择 了 8 
个 班 ( 每 个 班 的 学 生 估 数 为 40 名 左右 }) ,这 一 程序 误 叫 整 群 抽样 4cluster samplingy。 只 
于 在 感 兴趣 的 总 体 中 存在 很 雪 个 界定 清楚 的 整 群 .就 可 以 使 用 这 一 程序 ， 这 种 技术 有 两 
个 明显 优点 :第 一 , 它 相对 快捷 ,容易 得 到 大 样 末 ;第 二 ,对 被 试 的 处 理 和 测量 常 以 整 群 方 
陈 进 行 , 可 以 大 大 加 快 研 究 进 程 。 在 整 群 抽样 中 .研究 者 不 是 选择 单个 被 试 ,不 是 对 单个 
拼 试 施 加 处 理 , 不 是 每 次 只 测量 到 一 个 分 数 :而 常常 是 对 整 群 施加 处 理 ， 每 次 可 检测 一 群 
信人 ,从 一 次 实验 中 就 能 很 便利 地 取得 很 多 个 被 二 的 数据 。 

4 . 癸 利 磋 样 

便利 抽样 Ceonvenience sampling) 是 -种 非 概 率 性 抽样 方法 ,也 是 心理 学 研究 中 实际 
EF 最 有 用 的 抽样 方法 。 在 便利 抽样 中 ,研究 者 只 使 用 那些 容易 得 到 的 个 体 作 被 试 ,被 选 
的 大 必须 是 那些 找 得 到 的 .乐于 参加 研究 的 。 所 以 ,在 心理 学 研究 中 ， 使 用 大 掌 生 被 试 量 
贡 罗 ,这 些 尝 生 通常 就 是 研究 者 的 学 生 。 

便利 抽样 被 看 作 是 一 种 比较 弱 的 抽样 方法 。 国 为 研究 者 不 试图 去 了 解 总 体 ,在 选择 
钙 试 时 也 不 使 用 随机 过 程 , 对 样 林 的 代表 性 很 少 控制 ,所 以 得 到 有 了 偏 样本 的 可 能 性 很 夫 。 
像 广播 电台 听众 热线 电话 调查 或 杂志 社 使 用 通信 方式 进行 的 调查 ,都 是 特别 值得 怀疑 
的 。 这 些 情 况 下 的 调查 样本 应 该 是 存在 偏差 的 .因为 只 有 那些 倾向 于 收听 这 个 电 各 节目 
或 倾 问 于 阅读 这 个 杂志 又 对 调查 的 主题 感 共 趣 的 人 , 才 愿 意 去 花 得 这 些 时 间 , 这 些 人 不 
可 能 是 一 般 估 群 的 代表 ， 


尽管 存在 明显 缺点 ,但 是 便利 抽样 可 能 还 是 被 使 用 量 允 的 方法 。 与 那些 既 需 要 详细 了 
解 总 体 中 所 有 成 员 情 况 .又 需要 采用 费时 费力 的 随机 过 程 来 选择 被 试 的 方法 相 比 .便利 抽 
样 更 容易 .更 廉价 ,更 快捷 。 便 利 抽 样 虽然 不 能 保证 总 能 得 到 有 代表 性 的 无 偏 样本 ,但 也 不 
人 能 瘟 率 地 将 其 看 作 是 一 种 毫 无 补救 希望 的 抽样 方法 。 通 常 ,可 以 使 用 两 种 策略 来 纠正 便利 
抽样 中 的 主要 间 题 。 首 先 ,研究 者 尽 可 能 地 确保 他 们 的 样本 有 具有 相当 的 代表 性 而 无 大 的 偶 
状 ; 其 寥 ,详细 地 说 明 样本 是 如 何 得 到 的 .参加 研究 的 被 试 是 哪些 人 ， 

最 后 ,还 需要 说 明 的 是 :如何 确 定 样 素 容量 。 样 本 容量 没有 绝对 的 标准 ,也 不 存在 赫 
格 的 计算 方法 ， 但 依据 研究 未 身 的 特点 和 目的 ,确定 样本 容量 实际 上 是 要 在 可 行 性 河 准 
确 性 之 间 进 行 平 衔 。 一 般 来 说 ,样本 容量 武大 ,结果 准确 性 越 好 ,但 研究 实施 的 难度 越 
天 ; 样 寺 容量 越 小 ,结果 准确 性 越 益 , 但 研究 实施 的 难度 越 小 。 如何 取 会 , 除 考 虑 准确 性 
外 ,还 要 看 研究 的 内 容 与 研究 的 类 型 。 以 下 三 个 方面 的 考 虚 对 于 确定 样本 容量 是 用 
助 的 ;: 

第 一 ,研究 的 内 容 。 研 究 中 所 要 测量 的 心理 现象 或 心理 品质 , 越 是 受到 生物 性 的 制 
约 , 个 体 间 的 差异 就 越 小 .需要 的 研究 样本 就 可 以 较 小 。 如 关于 感知 机 制 的 研究 ,事件 相 
关 电 位 (ERP) 变 化 模式 的 研究 等 。 研 究 中 所 要 测量 的 心理 现象 或 心理 品质 , 越 是 受到 社 
会 文化 的 制 芍 ,个 体 间 的 差异 就 越 大 ,需要 的 研究 样本 就 越 大 ， 

第 二 ,研究 对 象 个 体 间 的 同 质 性 。 总 体 中 个体 间 的 同 质 性 越 高 ,个 体 差 异 越 小 ,根据 
抽样 规律 ,抽样 误差 也 越 小 ,需要 的 样本 容量 就 可 以 较 小 ;反之 .需要 的 样本 容量 就 较 大 。 

第 三 ,研究 的 类 型 。 利 用 心理 实验 室 严格 控制 实验 条 件 , 对 被 试 的 心理 活动 或 心理 


特征 进行 观测 ,测量 过 程 中 产生 的 误差 较 水 ,研究 样本 可 以 较 小 :利用 上 陈晨 必 对 被 斌 的 第 
心理 特征 进行 测量 ,被 试 反应 容易 受到 多 种 因素 的 影响 ,测量 误差 会 比较 大 ,研究 样本 就 齐 
需要 较 大 ， 引 
三 、 从 样本 推断 总 体 的 风险 上 

| 

研究 者 总 是 希望 以 样本 观测 的 结果 推 凯 总 体 特征 和 运动 规律 。 可 基 抽 样 过 程 会 在 : 


一 定 程度 上 造成 样本 特征 与 总 体 特征 的 储 离 ,同时 市 基 本 身 的 随机 误差 也 会 造成 样本 珊 
测 结 果 偏 离 总 体 特征 ， 抽 样 偏 盖 和 测量 中 的 随机 误差 都 属于 随机 误差 . 它 是 导致 样本 推 
断 总 体 出 现 错误 的 主要 风险 源 ， 

举例 来 说 , 某 中 学 教师 为 了 改进 教 党 ,对 丙种 解 史 数学 应 用 是 的 教学 方法 进行 比较 ， 
干 是 对 爹 校 高 中 二 年 级 的 学 生 进行 了 数学 应 用 题解 题 能 力 的 测试 ,再 从 测试 成 绩 非 常 接 
近 的 120 各 学 生 中 随机 抽取 了 20 名 同学 作为 被 试 , 这 些 被 试 允 被 随机 分 成 各 组 和 旦 组 ， 
每 组 10 人 。 对 上 A 组 被 试 采用 教学 方法 一 ,对 B 组 被 试 采用 教学 方法 二 .教学 周期 为 一 个 
学 期 。 学 期 结束 时 ,对 两 组 被 试 进 行 数 学 应 用 题解 晤 能力 测试 ,结果 发 现 A 组 同 掌 的 平 
均 分 数 为 85 分 ,BB 组 同学 的 平均 分 为 765 分 ，A 组 平均 比 BB 组 被 试 高 出 了 9 分 ,那么 能 否 
认为 教学 方法 一 比 教学 方法 二 更 为 有 效 呢 ? 

我 们 在 妨 来 分 析 一 下 ,造成 这 个 9 务 之 差 的 可 能 原因 有 哪些 。 应 该 说 ,以 下 国 项 都 
是 可 能 的 原因 :1) 分 组 信 差 ,虽然 分 组 前 进行 了 测试 ,但 是 测试 林 身 是 会 存在 恋 装 的 ， 
120 名 身 数 接近 的 同学 并 不 一 定 直 的 是 数学 解 题 能 力 和 学 习 能 力 接近 的 ,他 们 必然 存在 
差异 ,这 种 差异 也 会 造成 分 组 的 凡 差 , 妈 可 能 造成 A 组 和 BB 组 被 试 在 教学 实验 开始 之 前 ， 
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二 局 的 解 题 能 力 和 学 习 能 力 就 存在 差异 :2) 教 学 实验 过 程 中 的 各 种 干扰 因素 ,如 老师 讲 
课 的 个 人 风格 ,学 生 学 习 的 个 人 风格 . 刻 背 程度 ,接触 的 学 习 材 料 的 差异 性 ,各 种 环境 因 
条 的 影响 等 等 ,都 可 能 造成 这 20 名 同学 一 个 学 期 中 学 习 成 绩 的 分 化 ,出 现成 绩 差异 ， 
(3 尝 期 结 划 时 的 成 绩 测 试 也 会 存在 许 允 偶然 因素 的 影响 4(4) 两 种 教学 方法 所 产生 的 教 
学 效果 不 同 ;……。 这 样 说 来 ,9 分 之 差 可 能 是 教学 方法 森 同 带 来 的 ,也 可 能 是 其 他 一 些 
随机 因素 的 变化 引起 的 ， 

统计 党 的 分 析 导 辑 是 ;如果 假设 样本 之 间 的 差异 完全 与 实验 者 操纵 的 ,系统 性 改 蛮 
的 变量 无 关 , 那 么 这 些 差 异 就 是 由 于 随机 误差 因素 带 来 的 。 在 这 样 的 假设 下 ,统计 学 会 
证 助 我 们 分 析 , 随 机 误差 造成 样本 间 这 种 羔 异 的 概率 是 多 少 呢 ?7 拿 上 述 的 例子 来 说 ,入 
组 栖 卫 组 的 9 从 差异 完全 由 随机 误差 因素 造成 的 概率 是 禾 少 呢 ? 假如 ,这 个 概率 是 很 小 
的 ,小 于 5 吕 , 就 被 认为 是 小 概率 ,而 小 概率 事件 就 是 “不 大 可 能 ”事件 , 换 句 话说 ,如 此 大 
的 9 分 差异 不 到 可 能 是 随机 误差 造成 的 ,而 是 和 祖 可 能 由 教学 方法 的 不 同 所 造成 ;假如 ,这 
个 慨 率 是 8 吕 , 太 于 5 中, 统计 学 就 不 再 将 其 看 作 是 小 概率 ,这 个 9 分 的 差异 有 大于 5 叱 的 
可 能 性 是 随机 误差 造成 的 ,等 于 是 说 :不 能 太 确 定 这 个 9 分 之 效 是 由 教学 方法 造成 的 。 
为 了 避免 可 能 的 错误 晤 论 , 于 是 会 接受 "教学 方法 可 能 与 成 绩 间 的 善 异 无 关 " 的 结论 , 沿 
下 能 确定 教学 方法 一 好 于 教学 方法 二 。 

心理 统计 学 中 相当 的 篇 幅 都 是 在 讨论 类 似 于 这 个 例子 的 统计 推断 , 即 从 样本 观测 的 
薄 米 是 理 具 有 一 般 意 义 。 可 是 ,我 们 看 到 ,这 种 统计 推断 不 管 得 到 什么 结论 ,都 存在 错误 
风险 。 上 述 例 子 中 ,如 果 9 分 差异 由 随机 误差 造成 的 概率 小 于 5 听 , 这 时 否定 “教学 方法 
与 学 生成 绩 无 关 " 的 假设 ,就 会 有 不 到 5 凤 的 错误 风险 :如果 9 分 过 并 由 随机 误差 造成 的 
概率 是 85f ,这 时 接受 "教学 方法 与 学 生成 绩 无 关 ” 的 假设 ,就 会 有 更 大 的 错误 风险 ， 

统计 学 在 数据 资料 分 析 过 程 中 ,是 基于 概率 来 得 到 蛙 论 的 ,所 以 兽 是 存在 错误 风险 ， 
风险 控制 因 椒 同 的 课题 性 质 而 定 ， 


第 四 节 ”请 计算 机 代劳 :SPSS 浏览 


一 、SPSS 的 诞生 与 发 展 


SPSS 是 Statistics Package for Social Science 的 英 冯 第 写 , 它 最 初 是 由 斯 坦 福 太 学 的 
= 名 大 学 生 了 于 1968 年 开发 的 统计 软件 分 析 系 统 , 并 基于 该 系统 于 1975 年 在 芝加哥 合作 
成 立 了 SPSS 公司 。 该 公司 不 断 地 对 统计 分 析 软 件 进行 改进 ,先后 出 现 了 10 余 个 版 本 ， 
该 软件 目 前 仍 处 于 不 断 地 更 新 和 完善 过 程 中 , 基 一 种 国际 上 最 著名 和 使 用 最 广泛 的 统计 
分 析 软 件 ,也 是 教育 学 ,心理 学 研究 中 最 有 效 的 资料 分 析 工 具 。SPSS 的 统计 分 析 功 能 十 
分 强大 ,能 完成 许多 种 简单 与 复杂 的 数据 分 析 过 程 。 

SPSS 公司 在 20 世纪 加 年 代 连 续 收 购 了 才 家 同类 公司 后 ,由 原来 单一 统计 产品 的 
开发 与 销售 向 企业 ,教育 科研 及 政府 机 构 提 供 全 面 信息 统计 决策 支持 服务 ,成 为 走 在 最 
新 流行 的 "数据 仓库 "和 "数据 挖掘" 领域 前 洛 的 一 家 综 侣 统计 软件 公司 ,公司 最 近 块 定 将 
其 英文 全 称 更 改 为 Statistics Product and Service Solutions, 意 为 "统计 产品 与 服务 解决 


方案 ”, 其 英文 蓟 写 不 变 ， 

二 、SPSS 的 基本 视窗 

就 本 章 来 说 ,不 对 SPSS 的 操作 原理 做 具体 说 明 , 只 是 给 出 一 个 概貌 的 描述 。SPSS 
系统 最 基本 的 视窗 有 三 个 ;数据 编辑 器 .语句 编写 器 和 结果 输出 视窗 . 


(一 ) SPSS 数据 编辑 机 (SPSS Data Editor) 

数据 文件 编辑 窗口 一 般 是 SPSS 程序 启动 后 默认 打开 的 视窗 ,打开 后 的 状态 如 图 1 -2 
所 示 。 这 个 窗口 也 是 SPSS 的 工作 台面 , 即 用 户 可 以 在 这 个 界面 上 进行 数据 文件 的 建立 ， 
查阅 和 编辑 ,并 通过 点 击 革 单 条 进行 各 种 统计 分 析 和 制图 工作 ， 
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图 1-=2 SPS3 数据 编辑 画图 示 


该 视 徐 简捷 明晰 ,其 主 区 由 变 基 列 和 个 案 行 对 应 的 数据 组 成 。 也 就 是 说 ,数据 表 列 
中 的 每 一 列 都 代表 一 个 变量 ,每 一 行 都 代表 一 个 被 市 量 的 独立 个 案 。 一 般 情 半 下 ,研究 
中 的 每 一 个 独立 个 案 必 须 占据 数据 文件 窗口 中 的 一 行 ， 


(二 ) SPSS 语句 编写 器 (SPSS Sytax Editor) 

SPSS 的 早期 版 本 是 以 DOS 系统 支持 的 ,不 能 使 用 视窗 设计 ,所 以 主要 通过 编写 语 
名 来 完成 数据 分 析 功 能 。 目 前 ,在 Windows 操作 系统 支持 下 ,人 猎 究 者 越 来 楼 言 戏 采用 菜 
单 操作 , 即 通 过 菜单 打开 相应 的 对 话 框 ,对 话 框 能 更 直观 地 最 示 软 件 的 统计 分 析 功 能 。 
即使 如 此 ,一 些 特殊 的 操作 可 能 还 需要 异 助 于 语句 完成 ,而 且 有 时 语句 的 操作 可 以 带 来 
一 些 方便 。 例 如 ,进行 一 项 大 学 生 人 格 特质 与 心理 健康 等 英 系 的 调查 ,调查 者 使 用 了 “ 卡 
特 尔 16PF 问卷 ”和 "SCL - 90 状态 自 评 量 表 ”, 那 么 建立 的 SPSS 数据 文件 就 需要 定义 
277 个 以 上 的 变量 ,如 果 采 取 直 接 在 数据 编辑 器 中 写 出 变量 名 是 很 繁琐 和 费时 间 的 。 乐 
用 在 “SPSS 语句 编写 器 "中 写 命令 的 方式 就 非常 简捷 了 ,只 需要 在 语句 编写 侨 中 写 出 并 
运行 “DATA LIST FREE/KTEl TO KTE187 SCLI TO SCL90. ”就 可 以 在 数据 编辑 器 
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中 生成 277 个 变量 名 。 图 1 一 3 所 孙 就 是 一 个 SPSS 语句 文件 ,其 运行 结果 是 将 图 中 被 试 
的 性 别 ,数学 成 绩 ,语文 成 绩 恋 入 数据 文件 视窗 ,以 便 能 够 进入 统计 分 析 状 态 。 
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图 1=a3 SPSS 语 可 输 辑 器 


(三 ) 结果 输出 视窗 (Output-SPSS Viewer) 

结果 输出 视窗 可 以 呈现 SPSS 对 资料 进行 分 析 后 的 描述 性 或 推断 性 统计 结果 ,以 及 
按照 要 求 制 作 的 统计 图 .数据 赛 料 分 析 针 果 志 以 表格 的 形式 输出 ,这 些 表 格 与 心理 学 研 
究 报 告 写作 中 所 需要 的 表格 形式 很 接近 ,有 些 可 以 直接 粘贴 使 用 ,研究 者 也 可 以 根据 需 
机 重新 设计 表格 ,从 视窗 中 抄写 分 析 结 果 , 如 图 1-+ 上 所 示 。 输 出 的 统计 图 则 可 直接 在 
SPSS 结果 输出 视窗 中 进行 编辑 ,比如 对 线 图 进行 加 粗 . 摸 色 和 对 不 同 线 加 不 同 标记 符 等 
处 理 , 然 后 再 将 编辑 好 的 鱼 计 图 粘贴 人 到 文档 中 去 。 





图 1=4 SPSS 站 更 栓 出 规 窗 


三 、SPSS 应 用 的 一 般 过 程 


蕴 助 于 SPSS 进行 研究 资料 分 析 的 一 般 过 程 是 : 

步骤 1: 根据 研 究 设 计 建 立正 确 的 SPSS 数据 文件 ， 这 一 步 纵 的 关键 赋 是 要 准确 理解 
研究 的 程序 与 设计 模式 ,正确 识别 变量 的 数量 及 变量 的 性 砷 .准确 识别 独立 的 个 案 数 。 例 
如 , 某 学 校 高 三 年 级 主任 起 要 系统 分 析 全 年 级 8 个 班 360 名 学 生 在 坪 , 数 .外 三 门 诛 程 考试 
成 绩 上 是 否 存 在 性 别 差 异 ,班级 益 异 。 这 个 SPSS 数据 库 如 何 建 立 呢 ? 首先 要 识别 变量 :十 
文 血 数 .数学 分 数 .外语 分 数 , 学 生性 别 .学 生 所 在 班级 ,然后 确认 参与 考试 的 学 生 是 360 着 ， 
如 果 为 了 区 分 和 不同 的 学 生 而 将 学 生 的 学 号 也 作为 一 个 变量 , 那 各 这 个 数据 文件 就 是 六 个 变 
各 和 360 个 个 案 , 即 6 列 360 行 。 如 何 定义 变量 ,在 以 后 章节 中 专门 分 绍 , 此 处 暂 覆 ， 

步骤 2 根据 数据 分 析 的 目标 而 调用 相应 的 菜单 和 对 话 框 。 常 规 的 统计 分 析 都 可 以 
通过 药 单 条 打开 对 话 框 ,借助 于 对 话 框 可 以 非常 便捷 地 与 计算 机 对 话 , 提 出 数据 分 析 的 
要 求 和 参数 设置 ， 如 要 进行 学 生 数 学 成 绩 的 性 别 差异 比较 ,可 以 通过 Analyze" 中 的 
“Compare Means” 菜 单条 打开 平均 数 的 差异 性 1: 检验 对 话 框 ,并 将 要 分 析 的 数学 成 绩 变 
时 名 置 人 要 检验 的 变量 表 列 "Test Variables" ,将 性 别 变量 的 变量 名 置 作 到 分 组 变量 定义 
框 *Grouping Variable”" 中 ,如 图 1-5 所 示 。 
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图 1-5 独立 姐 平 均 数 差异 二 以 陪 
目 台 3: 输出 并 选择 分 析 结果 。 在 对 话 框 的 设 图 完成 之 后 ,点 击 *OK” 按 钮 就 可 以 输 
出 结果 ,根据 分 析 要 求 选择 所 需要 的 结果 ,并 以 适当 的 表格 或 图 形 表示 . 
步骤 4: 对 结果 进行 解释 。 针 对 具体 变量 的 性 质 和 调查 的 过 程 解释 所 得 结果 的 意义 ， 


第 五 节 ”如 何 更 好 地 掌握 心理 统计 学 


有 些 同学 还 不 了 和 解 " 心 理 统计 学 "就 盲目 地 认为 它 难 学 ,进而 产生 长 难 情绪 .这 其 实 
大 可 不 避 。" 心 理 统计 学 "的 学 习 远 比 有 些 同 学 想象 的 容易 。 为 了 更 好 地 党 所 心 理 统计 
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学 的 概念 ,原理 和 技术 ,以 下 儿 点 意见 或 许 是 可 以 参考 的 。 
一 、 重 视 理 解 随机 现象 与 随机 误差 


渍 理 统 计 学 属于 概率 统计 ,概率 统计 就 是 通过 统计 随机 事件 的 概率 来 把 握 随 机 现象 
的 特征 和 运动 规律 ,所 以 掌 习 中 首先 要 真正 理解 随机 现象 。 所谓 随 机 现象 (random phe- 
nomenon) ,就 是 其 运动 变化 具有 多 种 可 能 的 站 果 , 哪 种 结果 会 出 现 具 有 一 定 的 不 确定 性 ， 
比如 , 茶 一 和 学生 参 加 英语 四 组 考试, 他 能 取得 一 个 什么 样 的 分 数 , 就 具有 一 定 的 不 确定 
性 或 随机 性 ， 可 能 会 是 70 分 ,也 有 可 能 会 是 56 分 ,甚至 得 0 分 或 100 分 的 可 能 性 也 是 存 
在 的 ， 

随机 现象 的 运动 也 有 规律 .这 种 规律 的 把 握 就 是 通过 统计 其 中 各 种 随机 事件 的 要 
率 。 以 上 述 党 生 四 级 英语 考试 为 倒 , 不 同系 件 下 ,不 同 分数 出 现 的 概率 就 不 一 样 。 如 果 
这 种 掌 生 目前 正在 生病 ,能 不 能 参加 正常 的 考试 尚 不 能 确定 ,其 得 0 分 的 概率 就 增 大 ;如 
果 这 名 学 生 是 大 学 英语 专业 高 年 级 的 学 生 , 其 得 满分 的 概率 就 增 大 :如果 这 名 学 生 的 黄 
语 水 平 在 大学生 中 属于 中 等 或 偷 上 的 水 平 , 那 么 他 得 70 分 的 概率 就 增 大 。 这 一 例子 告 
诉 我 们 :事物 的 运动 虽 有 随机 性 ,但 随机 之 中 具有 规律 性 .时 计 学 就 是 要 在 这 些 随 机 变 
化 的 现象 中 认识 规律 性 ， 即 恒 考 试 分 数 具 有 随机 性 , 它 还 是 能 能 大 蛋 反 映 学 生 的 学 业 水 
平 的 . 

随机 误差 会 上 下 彼 动 ,在 重复 很 多 次 市 量 的 过 程 中 ,随机 误差 的 代数 和 接近 于 ,所 
以 我 们 泽 带 以 名 次 测量 的 平均 值 作为 描述 事物 特征 的 量 ， 


二 、 重 视 概念 理解 而 非 公 式 记忆 


不 少 学 生 觉 得 统计 学 难 党 ,部 分 的 原因 是 统计 学 中 有 一 些 看 上 去 很 复杂 的 公式 。 心 
理 统计 学 作为 一 门 应 用 统计 党 ,在 学 习 中 ,重要 的 是 理解 基本 概念 和 统计 学 原理 ,而 不 基 
记忆 公式 。 因 为 计算 机 软件 的 成 熟 ,我 们 在 实际 使 用 统计 党 来 分 析 数 据 资 料 时 ,其 间 的 
计算 都 是 由 计算 机 和 代 于 的 。 所 以 不 仪 没 有 民 要 去 记忆 公式 ,而 且 不 必 直 接 利用 公式 进行 
繁琐 的 计算 ， 

虽然 不 需要 直接 使 用 公 陈 进行 计算 ,但 对 公式 中 所 包 舍 的 变量 之 间 的 关系 要 有 清晰 
准确 地 理解 .统计 掌上 所 给 出 的 一 些 公式 也 是 为 了 帮助 学 生理 解 随 机 事件 的 概念 和 规 
律 ,理解 后 你 会 发 现 这 些 公式 中 的 道理 都 是 很 简单 的 。 

进行 过 心理 学 实验 研究 的 学 生 感 叹 : 对 数据 进行 方差 分 析 太 复杂 了 ! 真 的 很 复杂 
吗 ? 方才 分 析 , 还 不 旭 说 是 方 产 分 解 呢 。 为 什么 要 进行 方 状 分 解 呢 ?7 假如 你 想 比 较 一 
下 :是 没 蝎 酒 的 时 候 反应 快 , 还 是 在 喝酒 之 后 反应 快 ” 于 是 准备 了 些 笨 水 ;随机 选 来 了 20 
名 驾校 学员; 青 随机 分 成 两 个 相等 的 组 ,一 组 10 人 :让 一 组 学 员 在 不 喝酒 的 情况 下 测试 
芭 应 时 间 : 另 一 组 学 员 在 喝酒 之 后 测试 反应 时 间 ;: 于 是 得 到 了 20 个 大 的 反应 时 间 ， 分 析 
这 20 个 反应 时 间 , 你 会 发 现 其 中 存在 差异 :有 的 反应 快 些 , 有 的 反应 慢 些 。 分 析 一 下 原 
因 ,就 很 容易 知道 :两 组 之 间 存 在 喝酒 与 不 蝎 酒 的 系统 差异 和 一 些 难 以 控制 的 偶然 差异 ， 
系统 差异 可 能 带 来 两 个 获 据 组 的 差异 :偶然 差异 则 带 来 一 组 数据 内 部 的 差异 。 于 是 ,用 
统计 掌中 的 方差 方法 计算 20 个 数据 的 差异 性 ,再 将 其 分 解 为 组 间 方 产 和 组 肉 方 者 ,它们 
分 别 代表 这 些 数据 之 中 的 系统 差异 性 和 随机 差异 性 。 如果 系统 差异 明显 偷 大 ,说 明 喝 酒 


和 不 喝酒 条 件 下 反应 时 间 不 一 样 。 其 中 的 计算 虽然 复杂 了 些 , 但 包 侣 的 道理 非常 简单 ， 
应 该 不 难 理解 。 只 要 理解 了 其 中 的 道理 ,就 能 比较 准确 地 告诉 计算 机 该 怎么 做 ,计算 机 
自然 就 会 给 出 你 想 要 的 结果 。 所 以 ,现在 这 个 时 代 , 学 习 心理 统计 学 真是 容易 之 至 。 当 
然 , 这 也 要 有 一 个 条 件 , 那 就 是 你 在 学 习 心 理 统 计 学 的 同时 :还 要 学 会 一 些 PSS 软件 的 
使 用 与 操作 方法 ! 


三 、 联 系 生活 实际 与 心理 学 研究 实例 


经 常 有 学 生 抱 人 忽 :“ 老 师 讲 课 的 时 候 , 我 觉得 学 会 了 统计 学 。 但 是 一 过 到 实际 的 实 
验 数据 ,调查 问卷 资料 , 还 是 一 筹 莫 展 ,无 从 下 手 ! ”出现 这 种 情况 的 原因 是 什么 呢 ? 
其 中 的 关键 就 是 :学 习 中 设 有 注意 将 统计 学 与 实际 的 生活 现象 或 心理 党 研究 过 程 紧密 
结合 。 

我 们 学 习 统 计 学 ,就 是 为 了 解决 心理 学 研究 中 ,实际 调查 中 的 数据 分 析 , “所 以 学习 
过 程 中 ,应 当 避 免 统 计 学 与 心理 学 的 研究 .社会 生活 实际 相 脱 节 。 在 学 习 统 计 学 的 基本 
概念 .原理 和 计算 过 程 时 ,要 联系 生活 实际 中 相应 的 现象 ,心理 学 研究 的 模式 ,心理 学 研 
究 所 得 到 的 数据 模式 和 数据 分 析 目 的 ,这 样 不 促使 看 似 抽 银 的 统计 学 术语 变 得 更 为 具体 
和 生动 ,而 且 在 该 课程 中 掌握 的 数据 分 析 方 法 也 很 容易 迁移 到 实际 的 研究 案例 上 去 , 真 
正 做 到 学 以 致 用 ! 


四 、 依 靠 SPSS 技术 但 不 要 迷失 "自我 ” 


在 “心理 统计 学 "教学 中 ,我 们 主张 将 其 与 SPSS 软件 的 使 用 结合 起 来 , 即 在 一 定 程度 ”第 
上 将 统计 学 的 概念 .原理 和 数据 分 析 过 程 与 SPSS 系统 的 操作 融合 在 一 起 。 这 样 既 可 以 。 章 
减少 繁琐 的 计算 过 程 对 学 习 者 认 知 资源 的 消耗 ,又 可 以 消除 这 两 个 方面 不 同 内 容 教学 之 “3 引 
间 的 分 离 ,达到 事半功倍 之 效 。 上 

但 是 ,在 这 样 的 教学 处 理 的 过 程 中 ,要 防止 走 极 端 ,学 习 者 不 能 因为 SPSS 软件 的 操 多 
作 和 界面 非常 简明 .快捷 ,就 懒得 再 花费 太 多 的 时 间 和 精力 去 学 习 统 计 学 的 概念 .计算 原 


理 。 在 对 统计 党 的 原理 理解 不 清 的 情况 下 ,如 果 过 于 依赖 SPSS 的 界面 操作 ,机 械 地 执行 
SPSS 的 操作 ,不 加 理解 地 生 搬 硬 讲 ,容易 导致 三 个 错误 : 1) 数据 分 析 操 作 的 方向 性 错 
误 。 由 于 心理 学 研究 中 所 要 分 析 的 数据 资料 ,可 能 是 在 各 种 不 同 条 件 下 取得 的 ,资料 所 
获取 的 条 件 不 同 .测量 的 变量 不 同 ,数据 的 性 质 不 同 , 应 选用 的 统计 分 析 手 段 ,以 及 SPSS 
操作 的 参数 设置 都 应 是 下 一样 的 ,所 以 .只 有 准确 地 理解 了 资料 的 获取 过 程 ,才能 准确 地 
选用 数据 分 析 的 方法 和 手段 - (2 数据 分 析 结 果 的 剪裁 焉 当 。 什么 样 的 研究 .什么 样 的 
数据 资料 ,在 其 统计 分 析 中 ,都 有 相应 的 结果 要 求 , 在 准确 理解 研究 设计 及 数据 获取 过 程 
的 情况 下 ,才能 获取 适当 的 数据 分 析 结 果 ,并 剪裁 出 所 需要 的 分 析 结 果 。(37 对 结果 的 解 
释 不 足 或 不 准 ， 数 据 分 析 所 得 结果 能 够 说 明 什 么 问题 ,不 能 说 明 慎 么 问题 ,都 要 给 出 从 


当 的 解释 ,解释 不 当 就 会 导致 错误 的 结论 。 | 
所 以 ,在 依靠 SPSS 软件 系统 的 过 程 中 ,不 能 忽视 对 心理 统计 学 本 身 知 识 体 系 的 掌 
握 , 应 当 系 统 而 蕉 确 地 理解 心理 统计 学 的 基本 概念 .基本 原理 和 计算 过 程 , 否 则 ,就 是 背 
23 


本 这 来 了 。 


生生 大 演 同 m Ww 本 和 守 淮 胸 避 


一 亏 二 要 习 思 春 与 续 刁 时 于 


1, 数字 的 特性 有 哪些 ? 

2. 测量 的 量 表 有 哪些 种 类 ? 各 有 什么 特性 ? 
3. 什么 是 离散 变量 和 连续 变量 ? 

4, 说 明 总 体 , 样 本 与 个 案 的 关系 。 

5. 常用 的 抽样 方法 有 哪些 ? 

6. 什么 是 SPSS? 其 主要 的 视窗 有 哪些 ? 


第 二 章 ”数据 的 图 表 描 述 与 特征 量 
(aas 


科学 研究 都 是 从 分 类 开始 的 ,心理 学 及 其 他 行为 科学 也 不 例 让。 在 分 类 的 标志 上 要 
求 具有 单 向 性 ,以 避免 资料 把 握 的 混乱 。 在 对 总 位 或 样本 进行 研究 时 , 先 和 要 蒜 取 一 系列 
有 关 杰 量变 化 的 观测 资料 ,建立 变量 值 亚 化 的 次 喜 分 布 图 .分 布 表 系 统 , 这 是 资料 统计 分 
析 的 起 点 。 就 离散 变量 和 连续 变量 来 说 ,次 教 分 布 表 的 形式 有 所 不 同 ,前 者 直接 给 出 各 
不 同 变量 值 的 次 数 分 布 ,后 者 则 是 给 出 不 同 取 值 区 间 的 次 数 分 布 ,对 应 的 图 示 分 别 为 条 
形 图 和 直方 图 。 对 数据 资料 的 定量 描述 有 集中 量 数 ,差异 量 数 和 地 位 量 数 等 ,集中 量 孝 
主要 血 括 平均 教 . 中 位 教 和 众 数 ， 差 异 量 数 主要 包括 方 关 ,标准 差 、 四 分 位 差 和 全 中 等 ,地 
位 量 数 主 要 包括 百 分 位 数 、 百 分 等 级 。 通 常 把 描述 对 象 总 体 的 特征 量 叫 做 参数 ,描述 对 
象 样本 的 特征 量 叫 人知 统 计量 。 本 章 还 介绍 了 SPSS 吉 据 文件 的 建立 与 编辑 ,以 及 利用 
SPSS 系统 计算 描述 性 统计 特 宪 量 的 过 程 。 


研究 者 所 搜集 到 的 资料 ,一 开始 往往 显得 很 杂乱 。 这 就 需要 借助 于 一 些 有 效 的 手段 
进行 整理 和 描述 ,以 使 研究 者 及 答 了 解 相关 信息 的 人 人 ;更 容易 把 担 数 据 资料 的 特征 ,认识 
观测 的 对 象 ,为 进一步 的 统计 分 析 作 淮 备 。 对 资料 初步 整理 与 描述 的 方法 大 多 通过 统计 
表 列 和 图 示 ,然后 进行 初步 汇总 和 描述 ,得 到 一 些 能 反映 数据 特征 的 且 数 ,主要 是 集中 量 
数 . 差 异 量 数 和 地 位 量 数 。 为 描述 数据 特征 所 进行 的 这 些 初 步 统 计 分 析 , 叫 做 描述 统计 


(deacriptive statistles) 。 


第 一 市 ”统计 资料 的 表 列 与 图 示 


和 许多 传统 的 学 科 一 样 ,包括 心理 学 在 内 的 行为 科学 的 研究 也 常常 是 从 分 类 开始 
的 :需要 根据 测量 的 变量 值 对 研究 对 象 进行 分 类 ,然后 进行 各 种 差异 性 .相关 性 的 研究 。 
所 以 ,统计 党 也 介绍 的 方法 首先 就 是 数据 的 分 类 方法 ,后 镇 内容 也 由 此 开始 逐渐 推展 
开 去 。 

一 、 资 料 分 类 

在 种 完 设计 的 心理 学 研究 中 ,所 搜集 的 资料 很 多 时 悍 就 是 按照 不 同类 别 记录 的 ,其 
相生 可 能 就 是 分 类 走 料 。 也 有 些 时 候 , 实 料 是 杂乱 的 ,需要 加 以 初步 整理 , 即 按照 一 个 或 


于 岂 二 由 降 痊 于 国 于 瑚 各 才 [1 圭 





下 于 芝 半 避 


| 


雪人 个 变量 的 测量 娃 果 将 资料 归 类 ,凸显 资料 中 所 区 人 言 的 信息 ,为 进一步 统计 分析 和 资料 
缩减 提供 和 条件。 这 其 中 定 用 来 作为 分 类 依据 的 变量 叫做 分 类 标志 。 

分 类 后 的 资料 或 数据 常 以 表 列 .图 示 形 式 表 示 。 统 计 表 采用 数字 ,统计 图 采用 点 、 
线 .颜色 等 ,来 描述 类 别 与 娄 别 之 间 的 相互 关系 。 以 表 列 和 图 示 的 形式 所 表现 的 类 别 化 
数据 更 直观 明确 .易于 理解 ,但 其 质量 高 低 取 起 于 从 上 业 的 合理 性 和 有 瓯 性 。 有 具 蛋 地 说 ,要 
遵 入 两 个 原则 *， 

1 . 般 磺 航 完 目前 歼 人 证 闻 闫 株 吉 

不 管 是 针对 什么 样 的 研究 对 象 ,研究 目标 总 是 针对 一 个 或 案 个 变量 来 进行 的 ,更 多 
时 候 是 考察 过 个 变量 之 则 的 英 系 。 所 以 ,数据 分 类 要 服从 于 研究 目的 ,根据 研究 目的 选 
择 分 类 标志 。 如 果 和 研究 中 要 考察 不 同 研究 对 象 之 间 的 差异 性 ,就 需要 对 研究 对 象 进 行 
分 类 ,对 来 自 于 不 同 对 象 群 的 数据 进行 归 类 。 当 研究 对 象 是 在 校 学 生 时 ,常用 的 从 类 标 
志 如 性 别 . 年 级 .家庭 状 况 .学 业 成 绩 . 对 某 事物 的 态度. 是 否 选 修 某 门 课程 等 等 。 但 在 
具体 研究 中 .只 有 依据 研究 目的 选择 分 类 标志 才 是 适当 的 。 如 果 研 究 学 习 成 绩 的 性 别 
差异 , 那 就 要 选择 性 别 和 学 业 成 绩 两 个 变量 作为 分 类 标志 ;如 果 要 研究 职业 价值 观 与 选 
修 课 程 门 类 之 间 的 关系 ;就 需要 选择 其 对 和 皖 种 职业 定向 的 态度 以 及 选修 课程 的 门类 作 
为 分 类 标志 。 这 样 做 ,不 仅 使 得 数据 资料 清晰 有 序 , 而 且 便 于 进一步 考察 变量 间 的 闫 
系 。 甚 至 在 将 资料 按照 选择 的 标志 归 类 并 以 图 表 形 式 旺 现时 ,变量 的 关系 就 已 既 显 而 
易 见 了 。 

2 . 夯 一 个 分 类 和 奈 志 部 蚌 育 单 向 糙 

选 定 分 类 标志 后 ,就 可 以 将 观察 对 象 划 分 为 不 同类 别 .要 保证 分 类 的 合理 性 ,必须 首 
先 保 证 分 类 标志 的 单 癌 性 , 即 每 一 个 分 类 标志 都 必须 是 建立 在 对 象 的 革 一 确定 特征 上 
的 。 例 如 .按照 体育 测试 成 绩 可 以 把 学 生 划 人 苛 消 "达标 与 “未 达标 ”的 两 沫 ,或 者 " 忧 ”、 
“" 良 " “中 "“ 差 "四 类 ,但 是 "成 绩 较 好 ”、“ 成 绩 较 差 " 与 “训练 刻苦 ”、“ 训 练 不 刻苦 "就 局 于 
不 同 的 特征 ,不 能 同时 出 现在 一 个 分 类 标志 中 。 分 类 标志 要 具有 单 向 性 ,就 必须 满足 周 
延性 和 互 斥 性 ， 

(1) 周延 性 。 接 照 一 个 分 类 标志 所 作出 的 类 别 划 分 必须 是 周延 的 , 即 分 类 对 象 的 全 
体 都 无 一 得 尘 地 被 列举 出 来 。 或 者 说 ,所 有 对 人 清 都 能 被 划 归 到 该 分 类 标志 所 划分 出 的 一 
个 类 别 中 ， 

(2) 互 床 性 ， 按 照 一 个 分 类 标志 划分 出 来 的 类 别 帮 具有 互 床 性 , 即 各 个 类别 不 能 出 
现 相互 包容 或 变 灵 的 情形 . 按照 一 个 分 类 标志 ,属于 某 一 类 别 的 对 象 .就 不 能 再 属于 其 
他 任何 类 别 。 

如 表 -1 中 的 分 类 就 不 能 满足 分 类 标志 单 向 性 的 要 求 , 因 为 按照 表 中 所 分 ,并 列 的 
5 个头 别 若 和 不 具有 互 奈 性 ,而 恰恰 是 有 具有 相互 包容 性 ， 

表 2-1 某 心理 学 院 研 究 生 的 情况 汇总 表 
类 副 | [基础 心理 学 。 ”发展 与 教育 心理 学 应 用 心理 学 | 合 计 
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实际 上 ,这 里 包 音 的 是 两 个 分 类 标志 ,使 用 了 双向 的 分 类 。 为 了 更 有 效 地 表达 分 类 
对 象 的 铺 构 成 分 ,可 以 使 用 表 2 -2 所 示 的 双向 分 类 表 ; 以 性 别人 分 类 标志 定义 表格 的 行 ; 以 
研究 生 的 招生 方向 定义 表格 中 的 列 。 这 样 的 分 类 表格 既 能 够 有 效 地 反映 该 学 院 人 页 究 生 
的 组 成 ,又 使 得 两 个 分 类 标志 相互 分 开 ,都 满足 分 类 的 单 向 性 。 此 外 , 表 2 -2 中 的 信息 还 
很 容易 显示 出 ,学 生 分 布 中 "性别 "变量 与 “研究 方向 "变量 并 不 是 完全 独立 的 两 个 变量 ， 
而 是 相互 关联 的 两 个 变 基 ， 


表 2-2 某 心 理 掌 院 研究 生 的 情况 汇总 表 | 双 向 ) 









导 业 方向 
发 展 与 教育 心理 学 






基础 心理 学 应 用 心理 学 





通过 统计 图 表 对 研究 资料 进行 简 缩 ,常常 是 研究 过 程 中 必须 做 的 事情 。 但 也 必须 看 
到 ;数据 简 弟 在 上 同 显 某 些 美 键 信 息 或 主要 特征 的 同时 ,也 必然 会 丢失 部 分 信息 , 毕 吏 原始 
资料 中 的 信息 才 是 最 充分 的 。 在 运用 什么 变量 .如何 简 缩 数 据 以 及 保留 哪些 信息 方面 ， 
均 要 服从 于 研究 目的 的 需要 ,使 得 保留 的 信息 相对 于 研究 目的 来 说 是 充足 的 。 比 如 说 ， 
我 们 从 不 同 地 区 的 不 同学 校 抽取 了 不 同年 级 的 学 生 参 加 心理 健康 水 平 的 测试 ,在 资料 的 
简 希 过 程 中 要 保留 哪些 信息 就 要 看 研究 的 目的 。 如 果 是 为 了 比较 不 同 地 区 学 生 的 心理 
健康 水 平 , 可 以 使 用 "地 区 "变量 作为 分 类 标志 简 缩 数据 ;如 果 是 为 了 研究 不 同年 级 学 生 
的 心理 健康 水 平 ,可 以 使 用 * 年 级 "变量 作为 分 类 标志 ;如 果 是 想 研 究 不 同 地 区 和 不 同年 
级 学 生 的 心理 健康 水 平 , 则 分 类 标志 要 同时 包括 "地 区 "和 "年 级 "两 个 变量 ,采用 双向 分 
类 表 ; 如 果 是 要 第 选 出 一 些 有 严重 心理 健康 问题 的 学 生 , 则 保留 掌 生 个 人 的 测 查 资料 才 
是 充分 的 。 

我 们 已 经 看 到 :统计 分 类 可 以 带 来 不 少 便 利 , 而 且 统 计 分 类 的 缚 当 往 往 以 统计 表格 
的 形式 旦 现 出 来 。 在 实际 使 用 中 ,统计 表 的 形式 多 种 多 样 ,也 不 是 必须 采用 哪 一 种 形式 。 
只 要 符合 上 述 原 则 ,能 充分 表达 研究 者 的 需要 ,并 且 容 易 被 他 人 所 理解 的 统计 表 , 就 是 合 
理 有 效 的 。 不 过 ,在 统计 表 的 制作 上 ,还 是 有 一 些 要 求 的 。 尖 其 是 在 心理 学 研究 领域 ,有 
些 学 术 期 刊 编 辑 部 对 数据 表格 有 明确 而 具体 的 规定 。 一 般 来 说 ,表格 的 编导 和 标题 置 于 
数据 表 之 上 ,尽量 使 用 三 线 表 ,在 表格 的 最 左边 和 最 右边 不 要 加 封闭 线 , 保 持 表 格 的 一 种 
开放 性 。 


二 、 次 数 分 布 表 


次 数 分 布 表 又 称 频数 分 布 表 。 在 测量 中 , 它 反映 各 个 变量 值 出 现 的 次 数 或 某 一 变量 
值 取 值 区 间 内 变量 值 出 现 的 次 数 , 也 可 以 反映 各 类 别 中 测量 对 象 的 数量 ， 
如 果 分 类 标志 本 身 就 是 类 别 或 者 顺序 变量 ,那么 次 数 分 布 表 的 编制 就 很 简单 。 例 如 


表 2-3 所 示 的 数据 。 
性 
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表 2-3 某 心 理学 院 三 个 专业 方向 的 研 亮 生 人 人 数 分 布 表 













专业 方向 基础 心理 学 发 展 与 教育 心理 学 。 虚 用 心理 学 
A 肚 昨 立 30 了 站 站 过 





如 果 分 类 标志 是 等 距 连 续 ! 定 最 的 ) 变 量 ,编制 次 数 分 布 表 的 程序 就 要 复杂 一 些 。 表 
2 -4 所 示 的 是 某 一 中 学 商 三 年 级 520 名 学生 参 加 全 市 统考 的 语 立 成 绩 分 布 表 ;就 是 连续 
变 基 测量 结果 的 次 数 分 布 表 , 它 是 采用 区 间 计 数 方 法 制作 的 。 

表 3-4 3520 名 高 三 学 生 语 变 考 试 成 绩 的 次 数 分 布吉 





向 下 潍 计 
组 限 网 数 一 ”一 一 

次 数 师 豫 呈 
C1 (2) (6) (7) 
90 6 6 | 15 
EE 2 3 BG. 15 
80 45 77 14.81 
95 一 on 187 32. 12 
rr 150 317 io. 6 
上 一 13 作 中字 RB5. 06 
60 一 53 S00 96. 15 
55 一 15 5 15 99. 04 
50 5 520 Lo, 00 


通 肖 情况 下 , 表 2-4 中 的 前 三 列 就 已 经 构成 了 一 个 简单 的 次 数 分 布 表 .可 以 完整 地 
友 上 映 各 个 不 同 取 值 区 间 内 出 现 的 取 值 次 数 。 如 果 要 用 次 数 分 布 表 来 反映 某 分 值 以 上 或 
某 分 值 以 下 出 现 的 次 数 , 则 可 以 加 上 如 表 2 一 4 中 的 第 4) .05),t6) 和 第 (7) 列 。 

制作 简单 次 数 分 布 表 的 一 般 步骤 卫 ， 

步 枝 1: 计 算 全 距 (range)。 民 一 X 一 和 , 即 全 部 测量 值 中 的 最 大 值 减 去 最 水 值 
的 差 。 

步骤 2; 确 定 组 数 , 组 距 . 组 限 。 组 数 与 组 距 相 互 制约 ,组 数 少 组 距 就 夫 。 但 是 ,组 数 
越 省 ,进一步 统计 分 析 处 理 的 误差 也 就 越 太 ;而 组 数 太 名, 叉 失 去 了 分 组 简 六 资 料 的 本 
意 。 研究 中 ,一般 将 数据 组 数控 制 在 10 一 20 之 间 : 而 组 距 一 般 采 用 2.4.5.10 等 ,更 便于 
计算 数据 的 等 距 间隔 ;组 限 也 就 取 在 这 些 整数 值 上 .如 表 2 -+ 所 示 的 第 (1) 列 。 

步 曼 3: 登记 次 数 , 如 表 2-4 中 的 第 (2) 列 。 对 于 恰 为 组 限 的 数据 ,一 般 按照 “包公 下 
限 不 包含 上 限 " 的 原则 处 理 。 例 如 观测 结果 恰 为 80 分 时 就 将 其 归 入 到 80 一 85 一 组 ,观测 
结果 恰 为 85 分 时 就 将 其 归 人 到 85 一 9 一 组 。 

步骤 4: 登 记 频率 ,如 表 2-4 中 第 (3) 列 。 所 谓 频 率 , 就 是 该 组 次 数额 数 ) 除 以 观测 
总 次 数 寺 所 得 的 商 数 .。 频率 可 以 表示 成 小 数 的 形式 ,也 可 以 表示 成 百 分 束 的 形式 。 

较为 完整 的 次 数 分 布 表 ,还 可 以 包括 累计 次 数 ,累计 频率 。 累 计 的 方式 又 包括 * 向 上 
暴 计 "和 "向 下 累计 "两 种 情况 ,如 事 2 -+4 中 的 第 (4).(5).06)7 和 (177 列 -。 
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三 、 次 数 分 布 图 


与 统计 表 一 样 ,只 要 符合 统计 分 类 的 基本 原则 ,能 够 准确 ,清晰 地 表达 研究 者 的 意 
图 ,便于 他 人 理解 ,就 是 一 张 好 的 统计 图 。 

统计 图 也 要 有 一 个 简单 明了 的 标题 。 与 统计 表 不 同 ,习惯 上 将 统计 图 的 编号 和 标题 
放 在 统计 图 的 下 方 。 次 数 分 布 图 是 最 常用 的 统计 图 。 


(一) 条 形 图 

秀 类 标志 是 类 别 或 顺序 变量 时 ,其 变量 值 都 是 离散 的 数据 ,相应 的 次 数 分 布 图 一 般 
采用 条 形 图 (Bar Charts)。 如 图 2-1 所 示 的 资料 是 关于 某 太 学 一 个 班级 56 名 同学 毕业 
沦 文 的 成 绩 等 级 分 布 ,各 成 绩 等 级 对 应 的 人 数 是 ,“ 不 及 格 " 的 2 和“ 及格 "的 8 名 “中 
等 "的 13 名 “良好 "的 25 名 “优秀 "的 8 名 。 
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图 2-1 举 生 毕业 论 交 成 绩 等 好 半 布 图 图 2=2 某 校 商 三 学 生 语 训 统 著 成 精 分 布 图 


(二 ) 直方 图 

如 打分 类 标志 是 等 距 或 等 比 变量 ,绘制 次 数 分 布 图 要 用 直方 图 (Histograms)。 
图 2 -2 为 表 2 一 4 中 520 名 高 三 学 生 语 文 统考 成 绩 的 分 布 直方 图 。 每 一 直方 牺 都 是 以 组 
距 为 其 宽 座 , 以 该 组 的 观察 次 数 (或 频数 ) 为 其 高 度 。 与 条 形 图 不 同 的 是 ,直方 图 的 直 条 
之 间 设 有 空 际 ,是 紧 靠 在 一 起 的 ,而 且 横 轴 上 标 
记 的 数值 是 各 组 的 组 限 。 

(三 ) 折线 图 

折线 图 是 等 距 连 续 变 量 次 数 分 布 图 的 另 一 
种 形式 。 绎 制 折线 图 要 比 给 制 次 数 分 布 直方 图 
更 为 简便 。 折 线 图 以 各 组 的 组 中 值 为 横 坐 标 ， 
以 该 组 的 观察 次 数 ( 或 频率 ) 为 纵 坐 标 , 首 先 在 
二 维 坐 标 系 中 描 点 ,再 用 线段 依次 将 这 些 点 连 
接 起 来 。 我 们 还 使 用 表 2 - 4 中 的 数据 为 例 来 。 
收 折 强 图 , 图 而 :一 梧 所 示 的 就 有 是 某 较 高 三 学 生 语 S25 7460236 3 T2977. .3 B73 92.5 
文 统考 成 绩 分 布 的 折线 图 。 图 2-3 某 校 高 三 学 生 语 文 贱 考 成 绩 分 布 的 折 冯 图 
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(四 ) 关于 “曲线 "下 的 面积 

在 连续 变量 的 次 数 分 布 图 中 , 介 于 XX, 一 X, 之 间 的 “曲线 "下 的 面积 与 整个 “曲线 "下 
总 面积 之 比 , 就 等 于 观察 数据 中 取 值 介 于 Xi 一 站 之 间 的 个 案 数 在 观察 对 象 总 数 中 所 占 
的 比例 。 如 果 将 曲线 "下 的 总 面积 规定 为 1, 那 么 介 于 XI 一 Xs 之 间 的 面积 就 表示 取 值 
介 于 XI 一 Xs 之 间 的 个 案 所 占 的 比率 。 如 图 2 -4 所 示 灰 色 部 分 的 面积 代表 的 是 取 值 在 
该 范围 内 的 个 案 总 数 135, 而 该 部 分 面积 与 分 布 图 总 面积 的 比例 1357520 就 代表 取 值 在 
这 一 范围 的 学 生 数 占 总 的 学 生 数 的 比率 。 
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图 2=4 某 以 识 三 学 生 语 交 久 考 成 绩 分 布 图 





第 二 节 ”常用 集中 量 数 


集中 最 数 , 是 用 来 描述 一 组 数据 分 布 集中 趋势 的 数量 指标 。 在 研究 中 ,获得 的 数据 
往往 都 是 围绕 着 一 个 重心 (或 中 心 ) 时 现 出 上 下 波动 的 局 面 。 而 数据 的 集中 趋势 是 指 在 
一 组 数据 分 布 中 ,数据 的 取 值 有 向 分 布 中 心 集中 的 趋势 。 一 般 情况 下 ,集中 基数 正好 反 
喘 了 一 组 数据 的 重心 位 置 ,同时 也 有 反 时 了 数据 的 集中 趋势 ， 

可 以 反映 数据 集中 趋势 的 集中 量 数 很 多 ,如 算术 平均 数 、 几 何平 均 数 ,加 权 平 均 数 、 
调和 平均 数 .中 位 数 、 众 数 等 等 。 在 心理 学 研究 中 ,最 常用 的 集中 量 数 有 :算术 平均 数 . 中 
位 数 和 众 数 ，。 


(一 ) 算术 平均 数 的 定义 

算术 平均 数 (arithmetic mean) 是 一 组 数据 中 所 有 观测 值 X 的 代数 和 除 以 总 的 数据 
个 数 所 得 的 南 , 简 称 平均 数 或 均 数 (mean)。 为 区 分 总 体 与 样本 的 特征 量 , 一 般 用 a( 读 作 
miu) 表 示 来 自 于 总 体 的 数据 的 平均 数 ;用 处 ( 读 作 X bar) 表 示 米 自 于 样本 的 数据 的 平均 
数 。 总 体 与 样本 平均 数 的 计算 公式 可 以 分 别 写 为 ; 
DD 


一 3 ( 式 中 N 是 指 总 体 中 数据 的 个 数 ) ( 公 壕 2 一 1]1) 





| We: 

X 二 二 一 ( 式 中 是 指 样本 中 数据 的 个 数 ,也 称 样本 容量 ) (公式 2 一 2) 
一 般 ， 将 数据 代 大 上述 公式 ， 就 可 以 计算 出 总 体 平均 数 或 样本 平均 数 。 但 是 ， 有 
时 数据 并 非 是 以 原始 的 单个 数据 存在 ， 而 是 以 分 组 数据 存在 的 ， 即 缩 出 种 组 数据 取 值 
区 间 和 数据 个 数 ， 其 平均 数 如 何 计算 呢 ? 这 时 ， 内 能 采用 近似 方法 估算 平均 数 ， 和 将 每 
一 分 组 区 间 的 中 间 值 X, 看 做 是 这 一 数据 组 的 平均 数 ， 将 一 个 数据 组 的 数据 个 数 记 为 
F， 先 以 辣子 计算 出 各 组 数据 和 的 近似 值 : 然后 再 将 各 组 所 计算 的 数据 和 相 如 ， 即 
得 到 数据 组 的 近似 总 和 ; 最 后 除 以 数据 的 总 个 数 即 得 到 近似 平均 数 ， 其 计算 会 起 可 以 

写 为 ， 


X= 志 1 ( 式 中 夸 为 组 中 值 , /为 数据 组 中 的 数据 个 数 ) (公式 2 一 3) 

今后 ,为 括 述 方便 ,本 书 中 几 涉 及 算术 平均 数 的 .如 不 作 特别 说 明 , 针 简称 为 平均 数 。 

并 且 , 如 果 不 是 特 指 总 体 平均 数 的 话 , 一 般 用 样本 平均 数 符号 六 表示 ,有 时 也 用 符号 M 

(为 mean 的 缩写 ) 表 示 。 不 管 是 样本 平均 数 还 是 总 体 平均 数 , 它 们 作为 半 均 数 的 特性 起 

一 样 的 。 另 外 ,在 使 用 求 和 符号 ”Y "时 ， > X 可 以 简写 为 > X ,两 者 的 意义 是 一 
致 的 。 
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(二) 算术 平均 数 的 特性 

算术 平均 数 是 最 常用 的 集中 量 数 , 也 被 认为 基 一 种 良好 的 集中 量 数 ,因为 它 能 最 好 
地 反映 数据 组 的 集中 趋势 ,同时 国 为 它 具 有 如 下 一 些 特性 :也 给 研究 者 的 资料 分 析 审 来 
很 多 便利 ， 

(1) 所 有 观测 值 的 总 和 等 于 平均 数 与 数据 个 数 的 各 ,很 显然 ， >, 一 总 。 

(2) 省 观测 值 与 平均 数 的 差 叫 离 均 状 , 何 称 离 莽 。 pi 其 和 为 0, 即 
D(X—X)=0, 


(3) 每 个 观测 值 同时 加 上 (或 减 去 ) 任 意 常 数 忆 后 ,其 平均 数 等 于 原来 的 平均 数 加 上 | 
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《XX 土 S 

(或 减 去 ) 常 数 C, 即 2 = 站 二 
(4) 生 个 观测 值 同时 乘 以 任意 学 CCC 才 0) 后 ,其 平均 数 等 于 原来 的 平均 数 业 以 
(CC 二 





(三 ) 算术 平均 数 的 优 缺 点 

作为 一 种 良好 的 集中 量 数 , 算 术 平 均 数 始 有 优点 ,也 有 和 缺点。 其 优点 主要 有 : 

(1) 反应 灵敏 。 根 据 平均 数 的 定义 和 计算 过 程 , 它 的 大 小 与 数据 组 中 所 有 的 数据 邦 
有 关系 ,数据 分 布 中 恬 生 的 任何 一 个 哪怕 是 微小 的 数据 变化 都 会 引起 平均 数 的 改变 。 换 
名 话 说 ,平均 数 能 够 非常 灵 币 地 反映 全 体 数 据 的 变动 ， 





| 
| 
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LL ee ee 


(2) 有 严格 的 确定 性 ,根据 计算 公式 ,一 组 确定 的 数据 的 平均 数 也 是 确定 和 唯 
一 的 。 

(3) 适合 进一步 的 代数 运算 。 这 一 点 是 中 位 数 和 人 姑 数 无 法 做 到 的 。 

tt 受 抽 样 变动 的 影响 较 小 。 如 果 从 总 体 中 随机 抽取 名 个 样本 ,不 同样 本 间 的 样本 
平均 数 起 伏 变 化 较 小 ,反映 出 较 小 的 抽样 误差 。 相 比 之 下 ,中 位 数 和 众 数 容易 受到 抽样 
过 程 的 影响 ,不 同样 本 间 的 差异 可 能 很 太 。 所 以 ,在 后 续 一 些 涉及 统计 推断 的 章节 中 , 当 
需要 用 样本 数据 推测 总 体 特征 时 ,样本 的 算术 平均 数 就 是 总 体 平均 数 的 最 佳 无 偏 估 
计 值 。 

当然 ,事物 往往 都 具有 了 两面性 ,平均 数 的 主要 优点 是 对 数据 变化 比较 敏感 ,但 有 时 这 
怡 恰 丸 是 它 的 缺点 ,平均 数 最 主要 的 缺点 就 是 易 受 极端 值 影响 而 失去 典型 性 。 所 谓 极 端 
值 , 就 是 在 一 组 数据 中 出 现 的 极 太 值 或 极 小 值 ,它们 的 出 现 极 易 使 平均 数 恬 生 较 大 变动 ， 
失去 典型 意义 ,从 而 使 平均 数 明显 偏离 中 心 位 置 。 

【 例 2-1] 茶 公司 有 15 各 员工 ,他 们 某 一 年 的 年 薪 收 大 (单位 :元 ) 分 别 为 ;15000。 
15000、15000、15000、15000、17500、18000、17500 ,21000 .21000.26000 .21000 .40000 
1I00000.50000 ,请 计算 这 家 公司 员工 的 平均 年 某 收 人 ,并 思考 这 个 平均 数 能 代表 该 公司 
员工 的 典型 年 收入 吗 ? 

【 解 了 根据 题 意 , 计 算 15 名 员工 年 薪 收 入 的 算术 平均 数 ; 

到 二 2 15009+ 18000t .1 100000 十 60000 _ ,00 

该 企 司 员工 这 一 年 的 平均 年 薪 收 人 为 27800 元 。 但 在 所 有 的 15 名 员工 中 ,年 薪 收 
人 超过 这 个 数字 的 具有 3 人 ,其 余 员工 收入 都 低 于 或 远 远 低 于 这 个 数字 。 显 然 ,27800 并 
不 能 代表 该 公司 员工 的 典型 收入 或 中 间 趋 势 。 在 此 类 情况 下 ,算术 平均 数 就 不 再 是 良好 
的 集中 量 数 ,应 改 用 其 他 的 量 数 有 反映 数据 的 集中 站 势 。 

在 很 多 娱乐 或 运动 类 电视 节目 中 ,经 常会 看 到 ;在 给 选手 计算 最 终 得 分 时 ,往往 会 
“去 掉 一 个 最 商 分 ,去 掉 一 个 最 低 分 ,平均 得 分 ……"”。 这 种 做 法 就 从 某 种 程度 上 克服 了 
可 能 的 极端 值 对 算术 平均 数 造成 的 影响 ,使 评判 结果 更 具 典 型 性 和 可 靠 性 ， 

习 外 , 半 记 录 的 数据 性 质 不 同时 ,不 能 计算 数据 的 总 和 。 如 某 商 人 人 到 外 地 出 差 , 所 带 
现金 中 有 29000 美元 ,1000 元 人 民 币 .500 欧元 .10000 日 元 ,这 就 不 能 说 他 所 带 的 再 爹 一 
共 为 (2000 十 1000 十 500 十 10000) = 二 13500 元 。 该 商人 人 所 带 现 金 的 币 种 不 同 , 单 位 就 不 一 
样 ,因此 数字 到 小 的 意义 不 一 样 , 不 能 直接 相 加 ,可 以 先 按 照 金 融 市 场 当 时 的 价格 美 系 将 
其 转换 成 相同 的 币 种 和 单位 ,如 都 换算 成 人 人民币 ,使 其 从 "不 同 质 ”的 数据 转换 成 * 同 质 ” 
的 数据 ,然后 求 和 ， 

所 谢 " 同 质 ”, 即 性 质 相 同 ， 统 计 学 中 , 同 质 性 数据 是 指 用 相同 测量 标准 或 测量 工具 
得 到 的 用 来 说 明 相同 事物 属性 的 数据 “不 同 质 "的 数据 不 能 求 和 ,因此 也 就 不 能 计算 平 
均 数 。 假 如 某 人 和 曾 到 美国 .英国 .越南 旅游 , 均 在 当地 购买 了 同一 品牌 的 同一 日 常用 品 ， 
分 别 花 去 20 美元 ,14 英镑 ,20000 越南 导 ,请问 能 否 说 他 购买 一 件 这 样 的 日 用 品 平均 花 
费 现 金 是 420 十 14 十 20000) 二 3 一 6678 元 ? 显然 不 可 以 。 也 是 必须 先 根据 外 汇 牌 价 将 “不 
同 拷 "的 数据 转换 成 * 同 质 " 的 ,才能 计算 平均 数 。 





二 、 中 位 数 


(一 ) 中 位 数 的 定义 

中 位 数 Cmediany, 又 称 中 数 , 常 用 Md 表示。 将 一 组 数据 按照 大 小 顺序 排 位 后 ,位 于 
中 间 位 置 的 那个 数 ,就 是 中 位 数 。 因 此 :中 位 数 将 一 组 数据 分 为 大 的 一 半 和 小 的 一 半 。 
需要 指出 的 是 .中 位 数 既 可 能 是 现 有 数据 列 中 一 个 实际 有 的 数 ,也 可 能 只 是 一 个 潜在 的 
数 。 这 一 点 将 在 后 面 的 计算 实例 中 体现 出 来 。 

(二 ) 中 位 数 的 计算 

在 统计 学 中 ,连续 变化 的 数据 才 可 以 计算 平均 数 和 中 位 数 。 而 这 种 数据 常常 有 两 类 
不 同 的 记录 方式 ;一 类 是 保留 了 原始 的 每 个 数据 的 记录 方式 ,被 称 为 "未 分 组 数据 列 "; 一 
类 是 以 分 组 区 间 并 登记 了 每 个 区 间 内 数据 发 生 次 数 的 记录 方式 ;被 称 为 * 分 组 数据 列 ”。 
这 两 类 数据 列 的 中 位 数 的 计算 方法 有 所 不 同 ， 

1 . 未 分 组 内 握 到 前 中 从 协 计 蔓 

步 又 1: 排列 数据 。 将 所 有 数据 按照 从 小 到 大 (也 可 以 从 友 到 小 ) 的 峰 夺 排列 。 


步 马 2: 确定 中 位 数 的 位 置 及 中 位 数 。 若 数据 的 总 个 数 为 奇数 , 则 第 号 一 个 数 就 是 


第 

中 位 数 ;车 数据 的 总 个 数 ”为 偶数 , 则 取 第 立 个 数 与 第 { 达 二 1] 个 数 的 中 间 数 ( 即 这 两 个 “ 

| 数 

数据 的 平均 数 ) 作 为 中 位 数 ，。 

【 例 2-2] 试 计算 例 2-1 中 公司 员工 年 薪 收 入 的 中 位 数 。 图 

[ 解 ]】 因为 此 数据 列 是 未 和 分组 的 数据 , 先 将 所 有 数据 按 升 序 ( 从 小 到 天 ?排列 如 下 : 

15000. 15000. 15000., 15000, 15000., 17500., 17500, 18000., 21000., 21000., 21000., 26000，, 人 

40000 .600060 100000 。 人 
国 为 数据 个 数 为 w= 二 15 是 奇数 ， 所 以 取 第 号 一 一 8 个 数据 作为 中 位 娄 , 得 到 Ma 


一 18060。 

[ 例 2-3] 如 果 在 例 z- 1 中 的 公司 于 2007 年 初 新 引进 了 一 各 员工 ,其 当年 的 年 薪 
收入 为 22000 元 , 试 计算 将 该 名 员工 的 工资 数 加 和 数据 表 列 后 员工 年 棵 收 人 的 中 位 数 。 

【和解 】 现 和 将 公司 16 名 员工 年 薪 收 人 数据 按 升 序 排列 如 下 :15000.15000,12000 ， 
15000、 15000、17500,. 17500, 工 昌 向 站 站 21000; 21000. 21000s 22000. 26000,、 40000., 
60000 .100000 。 

这 时 数据 个 数 n=16 是 偶数 ,中 位 数 应 位 于 第 8 个 数 和 第 9 个 数 之 间 。 第 8 个 数 是 
18000, 第 3 个 数 是 21000, 所 以 Md = LOOT OO 前 面 曾 经 提 到 ,在 有 极端 


值 情况 下 ,如 果 用 算术 平均 数 来 描述 例 2 -1 中 公司 员工 的 年 薪 收 人 状况 典型 性 不 佳 。 此 
时 车 用 中 位 数 , 其 典型 性 就 比较 好 了 ， 

2. 分 组 数据 天 上 由 位 数 

对 于 已 经 分 组 的 数据 ,其 原理 与 未 分 组 数据 是 一 样 的 ,但 计算 相对 要 繁琐 一 些 。 主 
要 包括 以 下 几 个 步骤， 


步 又 1: 计算 数据 总 个 数 二 ,并 确定 中 位 数 所 在 的 分 组 区 间 , 即 找到 第 于 个 数 所 在 的 


| 
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区 间 ， 
步 桑 2; 计算 中 伺 数 万 在 区 间 以 下 各 区 间 的 次 数 和 ( 即 中 在 数 所 在 区 间 下 限 以 下 的 次 
数 办 加 ), 记 为 忆 ， 


步 又 3; 计 算 太 与 忆 之 差 。 


步 双 4 计算 在 数据 系列 中 第 过 个 数值 即 为 中 位 数 ， 


为 表述 方便 ,将 中 位 数据 在 区 间 内 数据 次 数 记 为 Au ,中 位 数 所 在 区 同 的 精确 下 限 记 
为 1。 和 假设 中 位 数 区 间 内 的 fw 个 数 拘 匀 地 分 布 在 这 个 宽度 为 i 的 区 间 内 ,那么 每 个 数 


占据 的 宽度 为 7 :而 中 位 数 到 该 组 下 限 之 间 的 数据 个 数 为 | > = | :因此 中 位 数 与 所 在 


区 间 的 下 限 L, 之 间 的 距离 就 是 [名 一 互 】* 二 ,所 以 上 十 (到 一 忆 )* 也 正好 是 中 位 
A Mi Le 
数 了 。 
概括 地 说 ,中 位 数 的 计算 公式 为 ， 


Md 一 了 ,十 2 3 (公式 2 一 4) 
同 理 ; 如 寻 把 中 位 数 所 在 区 间 的 精确 上 了 上限 记 为 上 , .将 访 上 限 以 上 的 数据 次 数 累 计 记 
入 为 FF, 则 中 位 数 的 计算 公 武 即 为 ， 
E 
本 Ma (公式 2 一 5) 
号 i | 
[【 例 2=41 革 年 斌 究 生 人 学 考试 中 , 革 考 区 120 名 考生 "普通 心理 学 "课程 的 考试 成 
> 绩 的 次 数 分 布 如 表 2 一 5 所 示 , 试 计算 这 120 名 考生 "普通 心理 学 "考试 成 绩 的 中 位 数 ， 
用 表 2-5 某 考区 考生 "普通 心理 学 "成 绩 的 次 数 分 布 表 
业 分 组 区 闻 
面 i 


gD 





【 解 】 从 理论 上 讲 , 考 试 成 绩 是 连续 变量 。 因 考生 数 为 120 名 ,所 以 数据 个 数 为 偶 
歼 , 可 以 认为 考生 成 绩 中 位 数 的 位 置 是 在 第 也 个 与 第 [地 十 1 个 之 间 , 即 第 60 个 与 第 61 


个 数 之 间 。 不 过 .分 组 数据 的 个 数 都 是 比较 去 的 ,所 以 在 这 种 情况 下 .为 了 简化 计算 过 
程 , 沙 王 区 分 的 奇 个 数 。 这 里 ,中 位 数 所 在 区 间 的 精确 下 眼 为 上 ,二 印 , 精 确 下 限 之 下 次 
数 果 加 记 三 13, 中 位 数 区 间 数 据 次 数 fw ==62, 区 间 间 有 蚂 = 10; 将 这 些 数 据 代 入 公式 


| -4 即 可 计算 出 护 数 据 列 的 中 位 数 ， 
, 二 TIT) 


Py i=60+ rs X10=67.58 





神 /22 一 i 
i 


使 用 公式 2-5 也 能 得 到 同样 的 千 果 : 该 未 分 组 数据 列 的 中 位 数 约 为 67,58， 





由 位 数 也 具备 pp 比如 ,定义 明确 .计算 简便 ， 
极端 数值 的 影响 , 受 抽 样 变动 的 影响 也 较 小 (但 比 平均 数 受到 的 影响 要 太 )。 然 而 它 
敏 性 不 如 平均 数 ,也 不 适合 进一步 的 代数 运算 ， le sp es 
据 中 出 现 极端 数值 个别 不 确切 数据 .或 者 其 他 不 能 用 算术 平均 数 作为 集中 基数 的 情况 。 
当 数 据 属于 顺序 量 表 水 平时 ,可 以 用 中 位 数 来 度量 其 集中 趋势 。 


三 、 众 数 


(一 ) 众 数 的 定义 与 计算 
一 组 数据 中 次 数 出 现 最 多 的 那个 数 , 即 为 众 数 (mode) ,用 Mo 表示 ,其 计算 也 很 简 
伍 , 只 需 和 将 数据 按 大 小 顺序 排列 ,用 观察 法 直接 寻找 出 现 次 数 最 多 的 那个 数 即 可 .如果 
ar 则 表 中 次 数 最 多 的 那 一 组 的 组 中 值 可 作为 众 数 。 
2 -1 中 公司 员工 年 薪 收 入 的 众 数 就 比较 简单 。 先 将 所 有 数据 按 从 小 到 大 的 顺序 
ol ee 则 六 人 要 于 二 帮 15000, 共 有 5 次 ,所 以 Mo 二 15000, 该 公司 
员工 的 年 薪 收 和 的 杂 数 为 15000 元 。 








众 数 作 为 一 种 集中 量 数 ， 其 性 能 不 及 平均 数 和 中 位 数 优 良 。 这 是 因为 , 众 数 虽 然 定 
义 简单 ,明确 ,也 不 受 极端 数值 的 影响 ,但 它 不 适合 代数 运算 , 受 抽样 变动 的 影响 较 大 。 
而 且 ; 当 次 数 分 布 表 设 定 不 同 的 组 距 时 , 众 数 的 数值 就 会 发 生 很 大 的 变化 ,因此 它 的 适用 
范围 非常 有 限 。 一 般 在 需要 极其 快速 而 粗略 地 估计 一 组 数据 的 集中 趋势 时 . 才 会 用 到 众 
数 。 另 外 , 当 一 组 数据 出 现 不 同 质 的 情况 时 ,也 可 用 众 数 来 表示 典型 性 情况 ,如 工资 收 
大 .学 生成 绩 等 有 时 会 以 次 数 最 多 者 作为 代表 值 ， 

相对 而 言 ,算术 平均 数 , 中 位 数 和 众 数 是 三 个 较为 常用 的 集中 基数 ,都 能 在 一 定 程度 
上 反映 数据 列 的 集中 趋势 ,所 以 具有 内 在 的 关联 性 。 在 数据 的 次 数 分 布 图 完全 对 称 的 特 
殊 情 况 下 ,这 三 个 集中 基数 就 会 相等 ,在 数 轴 上 重 省 为 一 点 ;如 图 2-5(b) 所 示 ,M=Md 
= Mo. 

如 果 数 据 分 布 是 不 对 称 的 ,其 次 数 和 分 布 图 表现 为 偏 于 左边 或 右 进 的 情形 ,那么 平均 





图 2-5 在 平 同 的 分 布 中 ,三 个 集中 量 数 的 法 录 赴 同 


TT 本 轩 再 半 曙 隐 蔬 囊 男 有 二 襄 情 |1 淖 


一 一 一 一 + 和 曾 量 二 本 克己 





数 . 中 伺 数 和 次数 谣 不 再 相等 。 由 于 平均 数 更 容易 受到 极端 值 的 影响 ,因此 平均 数 的 值 
肯定 会 因为 一 边 出 现 了 极 偏 的 值 而 也 随 之 偏向 于 这 一 边 。 具 体 地 说 ,以 测量 值 作为 横 坐 
剑 : 以 分 布 次 数 或 频率 作为 纵 坐 标 , 当 数 列 中 出 现 极 太 值 的 时 候 , 分 布 图 中 在 正 的 方向 出 
现 了 明显 偏 大 的 值 , 叫 做 正 偏 态 , 如 图 2-5(a) 所 示 , 通 常 在 这 一 分 布 中 ,MAMad 一 Mo， 当 
数列 中 出 现 极 小 值 的 时 候 , 分 布 图 中 在 负 的 方向 出 现 了 明显 偏 小 的 值 ,叫做 负 偏 态 , 如 图 
2-5Coc 所 未 ,通常 在 这 一 分 布 中 ，M 一 Md 一 AMo 


第 三 节 . 差异 量 数 


利用 平均 数 .中 位 数 . 众 数 等 集中 量 数 可 以 描述 一 组 数据 的 中 间 趋 势 ,从 一 个 侧面 反 
上 映 出 数据 列 的 特征 。 但 是 ,在 实际 中 ,人 们 发 现 仅仅 有 数据 列 的 集中 趋势 未 必 能 能 较 全 
面 地 描述 数据 列 的 特征 。 我 们 不妨 来 比较 下 列 三 组 数据 的 特点 ， 
甲 组 :50,50,50,50,50 
乙 组 ;48,49 ,50.51,52 
南 组 ,30,40,50,60.70 
四 然 , 三 组 数据 的 平均 数 都 是 50, 但 这 并 不 意味 着 三 个 数据 组 的 特征 一 样 。 可 以 看 
到 :中 组 的 数据 最 * 集 中”, 均 为 50; 乙 组 的 数据 分 散在 48 一 52 之 间 , 分 散 程 度 比较 小 ; 西 
组 的 数据 分 散在 30 一 70 之 间 , 分 散 程 度 比 较 大 。 可 见 , 三 组 数据 的 集中 量 数 虽然 一 样 ， 
但 是 分 散 程 度 却 不 一 样 , 所 以 看 上 去 具有 不 同 的 特征 ， 要 全 面 描述 一 组 数据 ,只 有 集中 
导数 是 不 够 的 ,还 必须 要 有 能 够 描述 数据 分 散 程度 的 特征 晤 ,我 们 将 这 种 特征 量 称 为 疾 
恒 贡 数 。 常 用 的 差异 基数 包括 全 距 , 四 分 位 差 ,平均 差 , 方 差 .标准 差 等 ,其 中 最 重要 的 县 
方差 和 标 淮 差 。 


一 、 全 距 、 四 分 位 差 和 平均 差 


(一 ) 全 距 

在 所 有 的 差异 基数 中 ,全 中 (range) 是 最 粗略 和 最 简单 的 , 它 是 一 组 数据 中 最 大 和 值 与 
最 小 值 之 差 。 一 般 来 说 ,全 距 越 大 ,说 明 数 据 越 分 散 , 反 之 数据 越 集 中 . 越 整齐 .上 述 三 
组 数据 中 , 甲 组 数据 的 爹 距 为 50 一 50==0, 乙 组 数据 的 全 距 为 52 一 48 二 4, 丙 组 数据 的 全 
眼 为 70 一 30 二 40。 这 说 明 甲 组 数据 最 集中 ; 乙 组 数据 有 较 小 的 分 散 性 ;再 组 数据 分 散 性 
较 大 。 分 散 性 大 ,也 可 以 说 成 是 差异 性 大。 然而 ,由 于 全 距 的 计算 只 是 使 用 了 数据 列 中 晤 
太 和 最 小 的 两 个 数据 ,所 以 它 极 易 受 极端 值 的 影响 而 降低 其 对 数据 分 散 程度 的 反映 力 。 就 
如 以 下 两 组 数据 ， 

一 组 :0.56,57,58,59,60 

二 组 :35,40,45,52,55,60 

其 中 一 组 的 全 距 是 60 一 0 二 60, 二 组 的 全 距 是 60 一 35 二 25。 但 实际 上 第 一 组 的 其 他 
数据 都 很 接近 或 比较 集中 ,仅仅 由 于 一 个 极端 数据 0 而 造成 了 较 大 的 全 距 。 所 以 ,全 中 
有 很 大 的 局 限 性 ,一 般 只 在 编制 次 数 分 布 表 或 需要 快速 而 粗略 地 考察 一 组 数据 的 分散 各 
度 时 才 使 用 。 


{ 二 ) 四 分 位 差 

前 文 已 经 提 到 ， 为 了 避免 受到 极端 值 的 影响 ， 日 常生 活 中 ， 我 们 经 常 采 取 去 掉 最 
高 分 和 最 低 分 的 方法 ， 即 主要 看 中 间 部 分 的 分 数 。 这样 做 的 确 可 以 在 某 种 程度 上 减少 
极端 数值 的 影响 ， 技 到 更 具有 代表 性 的 数据 ， 提 高 测量 的 稳定 性 和 准确 性 。 统计 学 中 ， 


岂可 以 借用 这 种 方法 剿 除 更 多 的 高 分 和 低 分 数值 ， 而 看 排列 在 中 间 的 也 个 数据 的 分 布 
情况 。 

四 分 们 差 (quartile) ,也 叫 四 分 位 距 。 计 算 中 先 去 掉 数 据 列 中 最 大 的 村 部 分 和 最 小 的 
部 分 的 数据 , 剩 下 米 的 中 间 这 一 半数 据 的 全 距 被 称 为 四 分 差 人 距 , 四 分 差 全 距 的 一 闪 
就 叫 四 分 位 差 , 一 般 用 QQ 表示 。 

Q= 生 一 所 (公式 下 一 6) 


公 趟 2 -6 中 ,在 由 小 到 大 排列 的 数据 中 ,Q, 和 Q, 分 别 是 去 掉 最 高 的 于 和 最 低 的 二 


第 

数据 后 ,所 剩 下 的 数据 的 最 大 值 与 最 小 值 ,正好 是 位 于 原来 二 处 和 于 处 的 数据 。 如 图 起 
2 -6 所 示 ,Q .Q; .Q, 可 将 一 组 按 天 小 顺序 排列 的 数据 分 为 个 数 相等 的 四 份 ,所 以 这 三 个 数 
位 置 的 分 数 也 叫做 四 分 位 数 。 其 中 @ 叫做 第 一 四 分 位 数 ;Q@; 叫做 第 二 四 分 位 数 ( 也 正 . 
好 是 中 位 数 );Q; 叫做 第 三 四 分 位 数 ;Q, .Q, 又 正好 是 前 半 段 和 后 半 段 数据 的 "中 位 数 "。 鱼 
四 分 位 数 的 计算 可 参照 中 位 数 的 计算 方法 进行 。 并 
Fr 一 网 分 位 全 中 一 一 | 日 

一 一 上 一 一 一 一 二 一 

min 2 全 oO, Fax @ 

国 三 = 皇 四 分 居 全 臣 示意 图 


【 例 2-5] 根据 表 2-5 中 的 数据 计算 其 四 分 位 差 ， 
5 解 】 类 似 于 中 位 数 的 计算 方法 ,可 以 得 到 Qi 与 Q@ 的 值 。Q& 就 是 前 的 个 数 的 中 
位 数 .Q, 就 是 后 60 个 数据 的 中 位 数 。 在 整个 数据 列 中 ,@@ 是 第 一 四 分 位 数 , 它 是 由 小 到 


大 排列 的 整 组 数据 中 的 第 士 X120 一 30 个 数 ,位 于 *60 一 "这 组 ;Q, 是 第 三 四 分 位 数 , 它 是 


怀 组 数据 中 的 第 子 X120 一 90 个 数 ,位 于 *70 一 "这 组 。 参 照 公式 2- 4 计算 如 下 ， 


ec: 
9,=1 二 到 4 一 上 as 一 6 由 
Di LT 62 
3 a 
43ndO— FEF ， . rE Ee 
人 一 了 十 一 一 s 一 了 0 十 A 1 二 了 和 4 29 
Fn 了 5 
Q= 中 = = .75 


i eg 


一 “条 半 押 的 胖 印 昕 症 于 一 稍 马 


参照 公式 2 -5 的 计算 方法 也 能 得 到 同样 的 结果 。 人 
要 简章 一些; 就 是 将 数据 按 从 小 到 去 的 顺序 排列 后 ， 找到 排 位 在 第 一 二 和 第 地 j 1 位置 上 


的 分 数 ,二 者 相 威 即 得 到 四 分 位 差 爹 距 , 该 四 分 位 荆 全 距 的 一 半 0 在 此 不 再 
举例 。 

与 全 上 距 相 比 ,四 分 位 差 日 除了 极端 数值 ,似乎 可 靠 了 许 雪 ， 但 从 另外 度 看 ,其 计算 
相对 较 紧 弄 , 且 把 略 了 大量 信息 ,不 适合 做 进一步 的 代数 运算 ,实际 中 较 少 使 用 。 


:平均 莽 
平均 莽 (average deviation) 是 指 一 组 数据 中 所 有 数值 与 平均 数 距 离 ( 离 均 差 的 饮 对 
值 ;的 平均 数 , 一 般 用 AD 表示 。 其 计算 公式 为 : 


i 
: 上 a 
= - (公式 2 一 7 


平均 闫 的 芋头 明 确 , 它 是 以 平均 数 为 中 心 和 -数值 与 平均 数 之 间 的 差 值 (XX 一 XX， 
也 叫做 离 差 ;看 作 误差 ,平均 盖 有 "平均 的 误差 "之 意 。 只 不 过 离 差 有 正 有 负 , 如 果 直 接 计 
算 色 和 ,根据 前 面 说 过 的 平均 数 的 性 质 , 则 离 差 之 和 为 0， 所 以 ,要 计算 平均 差 , 就 要 对 每 
个 离 状 取 绝对 值 后 再 求 总 平均 。 由 于 平均 差 的 计算 过 程 要 使 用 取 绝 对 值 的 步 曼 .使 得 代 
数 运算 过 程 不 方便 ,形成 了 平均 差 应 用 过 程 中 的 制药 因素 ,所 以 平均 差 在 实际 数据 分 析 : 
中 也 不 常用 。 


二 、 方 差 与 标准 差 

(一 ) 方差 与 标准 差 的 定义 

根据 前 文 讨论 已 知 , 离 差 tdeviation) 反 映 的 是 数据 组 中 某 一 个 数据 离开 平均 数 的 蚂 
离 ,而 将 所 有 数据 的 离 差 直接 求 和 ,其 结果 为 零 ,所 以 离 差 直接 求 和 再 平均 所 得 结果 不 能 
反映 一 组 数据 的 离散 性 。 而 取 绝 对 值 后 求 和 再 平均 所 得 到 的 平均 差 又 不 方便 进一步 的 
代数 运算 ,于 是 统计 学 家 采取 以 下 策略 来 解决 这 一 问题 ;将 数据 组 中 所 有 数据 的 离 差 平 
方 再 求 和 .所 得 结果 叫做 离 差 平方 和 ,也 叫 平方 和 (sum of square, 简 称 SS), 其 代数 表达 
形式 是 85 二 2 (XX 一 久 六 , 离 差 平方 和 除 以 数据 个 数 n 得 到 平均 的 离 差 平方 和 ,在 统计 
党 中国 方差 (variance)。 通 党 ,样本 数据 的 方差 用 5S: 或 5S: 表示 ,总 体 数 据 的 方差 用 下 表 
示 。 如 果 将 该 定义 中 的 所 有 要 素 一 一 对 应 地 在 公式 中 体现 出 来 ,这 样 的 公式 称 为 定义 公 
式 。 样 本 方差 S: 与 总 体 方 头 的 定义 公式 如 下 ; 





月 
《一 
8 — i (公式 2 一 8} 
本 
CR 
二 一 全 (公式 2 -9) 


显然 * 与 平 鬼 差 相 比 ,方差 先 将 离 均 差 平 方 然后 再 求 其 平均 数 ,避免 了 使 用 绝对 值 所 
引起 的 计算 不 便 , 同 时 也 非常 好 地 避免 了 直接 对 离 均 效 求 平均 数 ( 导 致 结果 为 零 ) 的 





进一步 分 析 离 差 平方 和 的 意义 。 就 一 数据 组 来 说 , 离 差 平方 和 SS 二 >》， (XX 一 下 )* 所 
反映 的 其 实 是 这 一 人 相 基 芋 曙 性 ， 比如 ,数据 组 中 省 个 数据 都 相等 
时 ， pd 即 闪 茵 : 和 所 以 SS 一 0 i 







很 简单 ， 如 果 选 择 其 中 一 个 数据 上 he 数 和 这 个 参照 点 一 一 作 比 
较 , 就 可 以 全 面 评估 这 组 数据 之 间 的 差异 。 也 就 是 说 ， 个 数据 之 间 的 差异 性 实际 上 是 
一 1 次 变化 量 的 总 和 ， 当 用 离 差 平方 ] 一 组 数据 中 数据 间 差 异 其 的 评 值 指标 时 ， 


它 除 以 Cx 一 1) 所 得 到 的 结果 才 是 真正 意义 上 的 平均 变异 量 ， 即 真 正 意义 的 方差 所 以 ， 
统计 学 上 更 为 准确 的 方差 计算 公式 是 : 

Pt 公式 2-10) 
或 写作 


Sim 宇 人 (公式 2-11) 
统计 掌 研 究 也 已 发 现 , 当 用 样本 的 方差 来 估计 总 停 的 方差 时 ,$*, 并 不 是 a* 的 最 佳 佑 
计量 ,而 是 一 个 有 俩 佑 计量。 后 来 证 明 ,s* -是 = 的 无 俩 估计 遇 , 也 是 最 佳 个 计量 ， 所 
以 ,在 方 莽 计算 中 ,如 果 是 按照 定义 进行 ,就 使 用 公式 2-8 或 公式 2-9;: 如 果 要 求 更 为 精 
确 地 计算 ,使 用 无 偏 估计 量 的 计算 方法 , 则 使 用 公式 2- 10 或 公式 2 一 11， 
很 显然 ,对 于 实际 的 副 量 数据 来 说 ,方差 的 单位 与 原始 数据 的 单位 和 不一致 ,前 者 是 后 
者 的 平方 。 拿 计算 一 组 长 度 测量 数据 (假如 单位 为 * 米 ") 的 方差 来 说 ,其 原始 数据 的 单位 
为 " 米 ", 方 莽 的 单位 就 是 "平方 米 ”", 二 者 就 无 法 进行 加 减 等 运算 ,于 是 ,统计 学 家 叉 提 出 
了 标 装 装 的 概念 :标准 蔓 fstandard deviation; 简 称 为 SD 或 5) 就 基 方 辣 的 平方 根 。 根据 
不 同 的 方差 计算 公式 ,得 到 了 下 列 三 种 不 同 的 标准 差 计 算 公 式 ; 


数据 总 体 的 标准 差 ， 
-i 
i (公式 2 一 J2) 


根据 定义 得 到 的 样本 数据 的 标准 差 : 


LLL 轩 负 革 盯 工夫 澡 国 全 顺从 期 |1 诗 


5 二 一 一 {公式 2 一 ]3) 
根据 无 侧 居 计量 要 求 得 到 的 样本 数据 的 标准 差 ， 

a | [公式 2 一 14) 

那么 ,依据 什么 原则 选择 计算 标准 差 的 公式 呢 ? 因为 条 数 情 况 下 两 种 方法 计算 得 

到 的 结果 不 会 差别 太太 ,所 以 通常 不 对 此 作 过 多 和 过 于 严格 的 规定 。 一 般 来 说 , 当 有 
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明确 要 求 时 ,按照 要 求 选择 计算 公式 ; 当 数 据 样本 容量 比较 小 (如 nn 二 30), 或 者 是 为 
了 进行 统计 推断 的 时 候 , 尽 量 使 用 公式 2 -14 计算 标准 差 5S,_1 ;着 样本 容量 n 比较 大 
(如 ww 主 30), 使 用 公式 2 一 13 计算 Ss 或 使 用 公式 2- 14 计算 5,_1 均 可 ,所 得 结果 相差 
不 太 。 


(二 ) 方差 与 标准 差 的 计算 

根据 定义 公式 即 可 计算 方差 与 标准 差 。 但 使 用 定义 公式 时 都 要 先 求 平均 数 , 再 求 离 
均 差 。 如 果 平 均 数 不 是 整数 ,或 者 是 一 个 除 和 不 尽 的 数 , 则 计算 过 程 就 会 比较 麻烦 且 易 带 
来 误差 。 此 时 ,也 可 直接 根据 原始 数据 计算 方差 与 标准 差 , 而 不 需 先 计算 出 平均 数 。 对 
应 公式 为 : 








i a 

方 整 ， 时 一 2 22 (公式 2 -15) 
i F 

标准 差 : 和 一 2 ZX 【公式 了-16) 
HH 








如 果 要 求 方 问 和 标准 差 是 总 体 方 差 和 标准 差 的 无 向 信 计量 , 则 相应 的 方差 和 标准 其 
公式 为 : 


2 
方差 : a 2 和 














7 一 1 mn 一 1 (公式 2 一 17) 
2 3 
标准 差 : hE a en (公式 2 一 18) 
n—] ntn— 1 ; 
【 例 2-6] 根据 定义 公式 , 试 就 本 节 开 始 所 举 三 个 数据 样本 分 别 计算 方差 与 标 


准 都 。 
【 解 ] 由 于 三 组 数据 的 平均 数 均 为 X= 二 50, 则 ;: 
甲 组 数据 的 方差 : : 
s+ = D(X— XY): (6050) (50—S0) 
昭 村 蕊 


时 


0 
标准 差 :5S, 二 0 
乙 组 数据 的 方差 ， 

第 二 (RO— XY: 


ni 


标准 差 ;:S, = vv200=10V2=14.14 

如 果 遇 到 分 组 数据 ,如 何 计 算 方 差 与 标准 差 呢 ? 根据 前 面 对 分 组 数据 求 平 均 数 的 思 
路 与 公式 2-3, 以 及 公式 2-15.2-16, 可 以 推导 出 对 分 组 数据 求 方 差 与 标准 差 的 公式 ， 
读者 可 以 根据 该 公式 自行 计算 表 2-5 数 据 的 方差 与 标准 善 。 计 算 公 式 为 ; 


人 
s:= 之 一 | 之 入 "7 ‘| (公式 2 一 19) 
| hn 
[ST TAO 
sm 2X7 (公式 2 一 20) 
| nl | 


公式 中 代表 分 组 数据 中 某 一 组 数据 的 组 中 值 ,7 代表 与 X, 组 中 值 对 应 组 的 数据 
个 数 。 


(三 ) 方差 与 标准 差 的 优 缺 点 

方差 与 标准 差 在 计算 过 程 中 要 用 到 一 组 数据 中 的 所 有 数值 ,无 一 遗漏 ,因此 ,它们 具 
有 反应 灵敏 的 优点 ,但 与 此 同时 也 带 来 一 个 缺点 , 即 易 受 极 端 值 影响 。 不 过 ,方差 与 标准 
差 定义 有 明确 ,计算 并 不 复杂 ,并 且 适 宜 于 进一步 的 代数 运算 。 而 且 根 据 样本 资料 计算 得 
到 的 S -是 总 体 方 差 e 的 最 佳 无 偏 佑 计量。 所 以 ,总 体 来 说 ,它们 具备 了 良好 差异 量 数 
的 特征 。 


(四 ) 标准 差 的 应 用 

1. 郑 异 票数 

标准 孝 作 为 一 个 尼 好 的 差异 量 数 ,用 途 非 常 广 径 , 其 最 直接 的 意 广 就 是 可 以 用 来 
比较 几 个 不同 的 数据 组 之 间 的 离散 程度 ， 一般 说 来 ,标准 差 越 大 ,数据 的 离散 程度 越 
大 ;反之 * 则 离散 程度 越 小 。 然而 ,有 时 候 情 总 并 不 如 想象 的 那么 简单 ,例如 下 列 两 种 
情况 : 

(1) 当 两 组 或 几 组 数据 资料 单位 不 同时 ,不 能 直接 用 标准 差 比 较 离散 程度 的 大 小 。 

【 例 2-7 已 知 某 地 区 6 岁 儿 童 的 平均 身高 是 1. 15 米 , 标 淮 差 是 0.08 米 : 平 均 体 
重 23 公斤 ,标准 差 是 4.2 公斤, 问 身高 和 体重 的 离散 程度 哪个 大 ? 

如 果 仅 仅 根 据 身高 的 标准 差 0.08 ,体重 的 标准 差 4.2 这 两 个 数字 的 大 小 来 判断 , 作 
出 出 高 的 离散 程度 小 ,体重 的 离散 程度 大 的 结论 ,肯定 基 不 恰当 的 。 假 如 将 身高 的 单位 
由 米 换 成 厘米 , 则 其 标准 差 的 数值 将 变 为 "8 ", 岂 不 是 “大 于 "体重 的 标准 差 了 吗 ? 可 见 ， 
对 于 有 不 同 测 量 单位 的 两 组 数据 来 说 ,不 能 直接 比较 其 标准 差 的 大 小 ， 

(2) 当 两 组 或 几 组 数据 资料 的 单位 相同 ,但 它们 的 平均 数 相 差 较 大 时 ,也 不 能 直接 
根据 标准 差 来 比较 它们 的 离散 程度 ， 

【 例 2-8] 有 人 用 同一 份 数学 试卷 同时 对 一 至 五 年 级 小 学 生 进 行 测试 ,结果 发 现 : 
五 年 级 学 生 的 平 的 成 绩 是 80 分 ,标准 莽 是 5 分 ,而 一 年 级 学 生 的 平均 成 绩 是 0 分 ,标准 
差 也 是 5 分 。 问 这 两 个 年 级 的 汕 验 分 数 中 哪 一 年 级 的 离散 程度 大 ? 

本 例 中 ,如 果 仅 仅 从 标准 差 的 大 小 来 看 ,可 能 有 人 会 作出 一 年 级 和 五 年 级 的 数学 成 
绩 离 散 程 度 一 样 的 结论 ,因为 两 者 标准 差 的 值 是 相同 的 。 然而 仔细 分 析 即 可 发 现 五 年 级 
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与 一 年 级 学 生 的 平均 成绩 相差 很 大 :标准 差 相 同 的 情况 下 ,五 年 级 学 生平 均 成 绩 高 ,相对 
差别 较 小 ;一 年 级 小 学 生平 均 成 绩 低 , 相 对 差别 较 大 。 可 见 , 直 接 用 标准 差 来 比较 离散 程 
度 的 大 小 ,是 不 科学 的 。 

那么 ,该 如 何 比较 这 两 种 情况 下 数据 离 向 程度 的 大 小 昵 ? 可 以 使 用 相对 差异 基数 ， 
最 常用 的 相对 差异 量 数 是 差异 系数 。 所 谓 差 异 系 数 ,也 叫 相对 标准 差 ,一 般 用 符号 CV 表 
示 : 是 指标 准 荆 与 其 算术 平均 数 的 比率 ,常用 百分数 来 表示 。 它 没有 单位 ,是 一 种 相对 系 
数 ,其 计算 公式 为 : 





CV= 症 X100% (公式 221) 
公式 中 ;5S 为 其 样本 资料 的 标准 闫 ,站 为 该 样 本 资料 的 平均 数 。 
现在 ,分 别 对 EE 例 2-73 与 [ 例 2 -8]3 荡 解 如 下 : 


在 [ 例 2 - 7] 中 : CVan =P X100% =6.96% 





Es = x100%=18.26% 


通过 比较 差异 系数 ,可 知 该 地 区 6 购 儿 童 体重 的 离散 程度 比 身 高 的 离散 程度 大 。 


在 [ 例 2 - 8 中 ， CVing = 二 关 100%= 二 6, 35 几 


80 


CV_#u=—75 X100%=12.5% 


通过 比较 差异 系数 ,可 知 一 年 级 学 生 的 测验 分 数 的 离散 程度 大 。 

在 应 用 差异 系数 比较 相对 离散 程度 时 ,应 注意 ,由 公式 2-21 可 知 , 如 果 平 均 数 为 0， 
则 差异 系数 没有 意 色 。 从 测验 理论 来 说 ,只 有 等 比 量 表 测 量 的 数据 组 的 平均 数 才 不 会 等 
于 零 ( 因 为 它 的 测量 起 点 是 绝对 零 ,所 以 测 得 的 任何 一 个 数据 都 应 是 大 于 零 的 ) 。 因 此 严 
格 地 说 ,也 具有 等 比 量 表 的 数据 才能 计算 差异 系数 。 不 过 ,那些 用 等 距 量 表 或 接近 等 距 
量 表 水 平 的 测量 数据 资料 ,如 果 平 均 数 不 等 于 零 , 如 育 分 制 考试 成 绩 等 ,也 可 以 降低 限制 
条 忻 , 使 用 差异 系数 。 总 之 ,使 用 差异 系数 时 ,数据 资料 至 少 应 为 等 距 量 表 水 平 ,因为 只 
有 此 时 ,计算 的 平均 数 和 标准 差 才 有 意义 。 

2. 原 洪 好 内 

在 统计 学 中 ,与 标准 差 有 关 的 一 个 重要 概念 就 是 标准 分 数 。 所 谓 标 准 分 数 , 又 称 基 
分 数 或 Z 分数 ,是 以 平均 数 为 中 心 ,标准 差 为 单位 ,表述 一 个 原 妈 分 数 在 其 团体 中 所 处 相 
对 位 置 的 数量 。 这 个 相对 位 置 ; 是 针对 平均 数 而 言 的 。 一 个 原始 数据 离 平均 数 有 针 远 ， 
可 以 用 标准 分 数 来 表示 它 在 平均 数 以 上 或 以 下 几 个 标准 差 , 从 而 明确 该 原始 分 数 在 团队 
中 的 相对 地 位 。 


(1) 标准 分 数 的 计算 公式 We (公式 2 -22) 
或 





Z 一 一 (公式 2-23) 


三 
公式 中 Z 为 标准 分 数 , 久 为 样本 平均 数 ,S 为 样本 标准 差 i 为 总 体 平均 数 ,a 为 总 体 
标准 差 。 


以 上 公式 也 非常 明了 地 显示 了 2 分数 的 意义 。 它 是 离 均 差 除 以 标准 差 之 后 所 得 的 
商 数 ,没有 实际 单位 。 它 既 可 以 是 一 个 正 数 5 当 原 始 分 数 大 于 平均 数 时 ) ,也 可 以 是 一 个 
负数 ( 当 原 始 分 数 小 于 平均 数 时 ,还 可 以 为 零 ( 当 原始 分 数 正 好 等 于 平均 数 时 )。 可 见 从 
Z 分 数 的 大 小 就 可 以 看 出 某 一 原始 分 数 在 团体 中 的 相对 位 置 。 

【 例 2-9]】 一 次 期 中 考试 , 某 班 同 学 的 数学 平均 成 绩 为 68 分 .标准 差 是 10 分 ， 考 
生 甲 . 乙 .两 三 人 的 成 绩 分 别 为 60 分 .68 分 .88 分 , 试 计算 他 们 数学 成 绩 的 标准 分 数 各 是 
名 少 ? 

【 解 了 已 知 志 天 68,S 一 10,X 一 60,X 一 68,X 一 88 

根据 公式 2-22 可 计算 得 到 ， 

Zn 一 于 二 一 一 0.8.Zz 一 一 一 0,Z6 一 
所 以 , 甲 . 乙 ,再 三 人 的 数学 标准 分 数 分 别 是 一 0.8.0.,2。 
(2) 标准 分 数 的 性 质 














性 质 工 :Z 分 数 无 实际 单位 ,是 以 平均 数 为 参照 点 ,以 标准 差 为 单位 的 一 个 相对 量 。 

性 质 有 | :一 组 数据 中 ,所 有 原始 分 数 的 Z 分数 之 和 为 零 ,Z 分 数 的 平均 数 亦 为 零 , 即 ; 
> Z=0,2 二 0( 很 容易 根据 其 计算 公式 来 证 明 })。 

性 质 而 :一 组 数据 中 ,原始 分 数 转 化 为 Z 分 数 后 ,其 标准 差 为 1, 即 S.=1( 根 据 性 质 
IT 和 标准 差 的 计算 公式 可 以 证 明 )， 

性 质 久 :如 果 原 始 分 数 明 正 态 分 布 , 则 转换 后 得 到 一 个 所 有 Z 分 数 的 均值 为 0, 标 准 
差 为 1 的 标准 正 态 分 布 (具体 说 明 见 第 三 章 )。 








(3) 标准 分 数 的 应 用 

诺 用 了 :用 于 比较 几 个 分 局 性 质 不 同 的 观测 值 在 各 自 数据 分 布 中 相对 位 置 的 高 低 。 

【 例 2-10】 小 明和 小 平 是 兄弟 全 ,分别 上 小 学 五 年 级 和 一 年 级 。 期 中 考试 结束 后 ， 
妈妈 发 现 , 小 明 的 数学 考 了 80 分 ,小 平 的 数学 考 了 85 分 。 能 否 说 明 小 明 的 数学 成 绩 不 
如 小 平 ? 已 知 小 明 所 在 班级 的 数学 分 平均 为 70 分 ,标准 差 为 10 分; 小平 所 在 班级 的 数 
学 分 平均 为 9 分 ,标准 差 为 5 分， 

[ 解 】 显然 ,兄弟 俩 分 属于 性 质 不同 的 团体 ,不 能 直接 比较 两 者 成 绩 的 高 低 , 而 应 从 
各 自 团 体 的 情况 作 具 体 和 分 析 ，2 分 数 怡 好 可 以 反映 兄弟 傈 在 各 自 团体 中 所 处 的 相对 位 
置 , 从 而 通过 比较 2 分 数 的 大 小 来 比较 兄弟 俩 成 绩 的 高 低 ， 根据 公式 2 -22, 计 算 可 
得 到 : 

六 一 二 一 人 =1.0: 2 一 —1.0 

所 以 ,尽管 从 分 数 上 看 ,小 明 的 8 分 低 于 小 平 的 85 分 ,但 小 明 在 他 所 属 班级 中 的 水 
平 处 于 平均 数 以 上 一 个 标准 其 的 位 置 ,而 小 平 则 处 于 平均 数 以 下 一 个 标准 差 的 位 置 。 可 
见 ,就 他 们 在 各 自 班 级 中 成 绩 的 排名 看 ,小 明 的 数学 成 绩 要 好 于 小 平 。 

在 实际 的 心理 与 教育 研究 中 ,经 常会 过 到 属于 儿 种 不 同 质 的 观测 值 。 这 时 不 能 对 它 
们 进行 直接 比较 ,而 应 根据 各 自 数据 分 布 的 平均 数 与 标准 差 , 分 别 求 出 工分 数 后 再 进行 
比较 。 

应 用 J 上 :计算 不 同 质 的 现 测 值 的 总 和 或 平均 值 ,以 比较 其 在 团体 中 的 综合 排 位 。 
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前 面 在 讲 到 平均 数 的 使 用 时 , 曾 提 到 ,直接 将 不 同 质 的 数据 相 加 计算 成 绩 的 总 和 
或 平均 值 是 不 人 台 适 的 。 但 如 果 这 些 不 同 质 的 观测 值 总 体 分 布 为 正 态 时 ,可 以 将 它们 都 
转化 为 Z 分 数 后 相 加 求 总 和 或 平均 数 , 这 样 就 变 得 有 意义 了 。 例 如 ,以 往 对 高 考 成 绩 
的 计算 , 常常 是 将 几 门 课程 的 成 绩 直接 相 加 求 总 分 , 但 实际 上 这 样 做 是 不 科学 的 ， 因 
此 也 是 不 公平 的 ， 国 为 这 几 门 课程 的 试卷 难 易 程度 很 难 做 到 完全 相同 ,会 造成 各 科 成 
绩 实际 上 的 不 同 质 。 所 以 不 能 直接 以 相 加 的 方式 求 总 分 , 而 应 改 为 先 对 各 门 课 程 的 成 
绩 求 Z 分 数 , 再 将 各 科 成 绩 的 Z 分 数 相 加 求 总 分 或 平均 分 这样 的 计 分 才 更 加 科学 
和 公平 。 类 似 地 ,期 末 考 试 各 科 成 绩 的 总 和 也 可 以 用 Z 分 数 来 合成 ,使 之 更 趋 科学 、 
合理 . 

[ 例 2-11】 下 表 是 甲 . 忆 两 名 考生 某 年 的 高 考 成 绩 。 试 问 根据 考试 成 绩 应 该 优先 
录取 哪儿 考生 7 


表 2-6 甲 . 乙 两 名 考生 高 考 成 绩 的 比较 





【 解 】 如 果 接 以 往 将 原始 威 绩 直 接 相 加 得 到 考生 的 总 分 * 则 考生 己 的 总 分 商 于 甲 ， 
乙 应 优先 被 录取 : 若 通过 公式 2-23 计算 考生 各 门 课 程 成 绩 的 标准 分 ,然后 相 加 得 到 标准 
分 总 分 , 则 考生 甲 的 总 分 商 于 考生 乙 , 甲 应 优先 被 录取 。 那 么 究竟 采用 哪 一 种 算法 更 台 
理 呢 ? 由 于 各 科 考 试 试卷 的 内 容 不 同 . 难 易 程 度 不 同 ,各 门 课 程 的 成 绩 分 数 具 有 不 同 的 
性 质 。 这 时 如 果 将 原始 分 数 简单 相 加 求 总 分 是 不 科学 的 ,因此 ,科学 的 方法 应 当 是 用 Z 
分 数 来 求 和 。 上 从 乙 分 数 的 总 和 看 ,考生 甲 的 多 数 成 绩 是 在 平均 数 以 上 ,即使 有 一 科 成 绩 
低 于 平均 玖 ,但 差别 也 很 小 :而 考生 乙 有 两 门 成 绩 低 于 平均 数 , 且 相 孝 的 幅度 较 大 - 用 芝 
分 数 来 确定 优先 录取 的 考生 更 为 台 理 ， 

应 用 耻 :经 过 线性 转换 后 表示 标准 测验 分 数 。 

由 于 标准 分 数 能 清楚 地 表明 某 一 分 数 在 相应 团体 中 的 排 位 ,所 以 很 多 标准 化 的 心理 
和 教育 测验 都 使 用 2Z 分数 来 表示 测 查 结果 。 但 是 2 分数 往往 含有 小 数 , 负 数 ; 不 易 为 非 
专业 大 士 所 理解 ,为 克服 这 些 缺 点 ,常常 对 其 进行 线性 转换 ,使 其 分 数 形态 更 易 为 人 们 所 
接受 ,其 实质 性 意义 不 发 生 改 变 , 即 这 种 线性 转换 不 改变 相应 分 数 在 团体 中 的 排 位 。 标 
淮 分 数 线 性 转换 的 一 般 公式 为 : 


LDL EL a 


Z=A*2Z+B (公式 2 一 24) 
公 址 中 ,Z 为 转换 前 的 标准 分 数 ,Z 为 转换 后 的 标准 分 数 ,4. 忆 为 常数 。 转 换 过 程 
中 ,在 原来 的 ZZ 分数 前 简 一 常数 A, 是 为 了 省 上 略 小 数 ; 加 上 一 个 常数 B 是 为 了 消除 负数 。 


A 看 生生 


例如 , 某 一 学 生 的 数学 成 绩 是 65 分 ,而 其 所 在 年 级 学 生 考试 分 数 的 平均 分 为 80 分 ,标准 
着 为 10 分 ,于 是 可 以 计算 得 到 该 学 生 数 学 成 绩 的 标准 分 数 Z 一 一 1.5 ,为 了 消除 小 数 和 负 
号 ,将 这 一 标准 分 数 乘 以 10 变 为 一 15, 再 加 上 100 ,该 标准 分 数 就 转换 为 Z 二 85。 

标准 分 数 经 过 这 样 的 线性 转换 之 后 ,仍然 保持 着 原始 分 数 的 分 布 形态 ,同时 仍 具有 
原来 标准 分 数 的 一 切 优点 。 例 如 , 韦 氏 成 人 智力 量 表 中 使 用 离 差 智商 表示 一 个 人 在 同龄 
团体 中 的 相对 智力 ， 

IQ=132+T 100 

在 这 个 公式 中 ,Z 一 全 三 ,其 中 ,X 为 被 试 在 智力 测验 中 的 原始 分 数 ,不 为 某 年 龄 团 
体 的 平均 原始 分 数 ,S 为 该 年 龄 团体 的 标准 差 。 而 公式 中 的 常数 100 与 15 实际 上 是 转换 
后 分 数 的 总 平均 数 与 标准 差 。 类 似 地 , 比 奈 - 西 蒙 智 力 测验 中 使 用 了 2 一 16Z 十 100 公 
式 ,普通 分 类 测验 (AGCT) 使 用 了 Z 二 102 十 100 等 等 。 

3. 异 帘 草 豚 灰 香 

在 统计 学 中 ,异常 值 的 出 现 会 影响 到 数据 列 集中 量 数 与 差异 量 数 的 计算 ,有 时 为 
了 消除 这 种 影响 ,可 以 把 那些 异常 值 从 数据 列 中 删除 ,但 是 这 里 的 数据 删除 不 是 随意 
的 ,而 是 有 一 定 标准 的 。 这 个 标准 一 般 被 称 为 三 个 标准 差 " 原 则 :在 一 个 正 态 分 布 中 ， 
平均 数 上 下 一 定 的 标准 差 处 ,包含 确定 百分数 的 数据 个 数 :以 平均 数 为 中 心 , 平 均 数 的 
3 个 标准 差 之 内 约 包含 99. 739 中 的 数据 。 即 使 不 是 正 态 分 布 ,根据 切 比 雪夫 定理 "在 


平均 数 的 户 个 标准 差 之 内 至 少 包含 有 1 一 声 的 数据 个 数 ", 也 即 平均 数 的 3 个 标准 差 之 


内 至 少 包 含有 约 89 览 的 数据 个 数 ， 所 以 ,在 整理 数据 时 , 常 采 用 三 个 标准 差 原 则 取 合 
数据 , 即 , 若 数据 的 值 落 在 平均 数 加 减 三 个 标准 差 的 范围 之 外 , 则 在 整理 数据 时 ,可 将 
此 数据 作为 异常 值 会 去 。 








第 四 节 地 位 量 数 


中 位 数 在 按 太 小 顺 友 排列 的 数据 列 中 占有 特殊 地 位 , 它 正 好 位 于 中 间 ; 而 三 个 四 分 
位 数 分 别 位 于 数据 列 中 的 四 分 之 一 ,四 分 之 二 和 和 四 分 之 三 处 ,将 数据 列 中 的 数据 个 数控 
分 数 由 低 到 高 的 硕 序 划分 为 四 等 份 。 这 些 划分 或 排列 都 是 按照 数值 大 小 顺序 进行 的 ,各 
个 数值 排列 位 置 的 不 同 ,也 反映 这 些 数值 在 数据 系列 中 地 位 的 不 同 , 所 以 这 些 排 位 数 也 
叫 地 位 量 数 ， 地 位 量 数 就 是 反映 特定 观测 值 在 一 个 数据 系列 中 所 处 位 置 或 地 位 的 量 数 ， 
共用 的 有 百 分 位 数 和 百 分 等 级 。 


一 、 百 分 位 数 


按照 类 似 于 确定 四 分 位 数 的 方法 ,分 别 以 数据 列 中 的 1 踊 .2 量 .…… 99 跌 位 置 上 的 
数值 为 分 界 点 , 则 可 以 将 数据 列 划 分 为 人 数 相 等 的 100 等 份 ,而 这 里 的 99 个 分 界 点 正好 
就 是 1 乓 的 位 数 ,2 各 的 位 数 .……… .99 匆 的 位 数 ,统计 学 将 这 些 位 数 统 称 为 百 分 位 数 。 所 
以 , 百 分 位 数 是 以 一 定 顺 序 排列 的 一 组 数据 中 某 个 百 分 位 置 所 对 应 的 值 , 一 般 用 P, 表 


一 ”生生 团 站 妆 盯 陈 草 澳 因 卫 前 全 册 !1 并 





$9 全 可 mn DWT 杜 半 全 网 全 


示 。 例 如 ,Pr 就 表示 70% 的 位 数 , 或 叫做 第 70 个 百 分 位 数 。 它 代表 在 按照 从 小 到 大 顺 
序 排 列 的 一 组 数据 中 的 一 个 可 能 数值 ,小 于 这 个 数值 的 数据 个 数 占 70%% ,大 于 这 个 数值 
的 数据 个 数 占 30%。 

三 个 四 分 位 数 中 ,第 一 四 分 位 数 正好 是 25% 的 位 数 , 第 二 四 分 位 数 正好 是 50% 的 位 
数 或 中 位 数 ,第 三 四 分 位 数 正好 是 75% 的 位 数 。 可 见 ， Ms 四 分 位 数 都 是 一 些 特殊 的 
百 分 位 数 。 

已 分 组 数据 百 分 位 数 的 计算 方法 可 以 参照 中 位 数 和 四 分 位 数 的 计算 方法 ,其 原理 不 
再 重复 。 计 算 公式 如 下 : 


ixN- F, 
P,=L, 十 A (公式 2-25) 
或 
(1 100)XN F. 
i (公式 2 -26) 


公式 中 ,N 为 总 次 数 

L, 为 百 分 位 数 所 在 组 的 精确 下 限 .U, 为 百 分 位 数 所 在 组 的 精确 上 限 

下 为 小 于 工 , 的 累计 次 数 、F. 为 大 于 U, 的 累计 次 数 

i 为 组 距 、f, 为 百 分 位 数 所 在 组 的 次 数 

【 例 2- 12】 根据 表 2-5 中 数据 计算 其 P,,. 

【 解 】 要 求 计算 的 是 40% 的 位 数 , 即 第 40 个 百 分 位 数 。 因 为 表 2 - 6 中 的 数据 共有 
120 人 ,所 以 从 最 小 值 开 始 计 算 的 40% 的 位 置 就 是 第 48 人 ,不 难看 出 ,这 个 人 应 在 
“60 一 "这 组 。 根 据 公 式 2 - 25， 区 


卫 ,。 王 60 十 62 
或 根据 公式 2 - 26, 可 得 ; 
(1- 斋 )x120 一 45 


62 
二 以 酝 分 等 久生 33 起 二 了 


百 分 等 级 是 百 分 位 数 的 道 运算 , 它 是 某 个 数值 在 以 一 定 顺序 排列 的 一 组 数据 中 所 对 
应 的 百 分 位 置 ,用 PR 表示 。 在 例 2 - 12 中 ,如 果 先 给 出 一 个 数 65. 65 ,要求 计 算 该 数值 
在 整个 数据 表 列 中 的 位 置 , 根 据 前 面 计 算 所 知 Pu 一 65. 65, 所 以 该 例 中 也 肯定 能 计算 得 
到 PR 一 40。 

根据 百 分 位 数 的 计算 公式 可 以 推导 分 组 数据 的 百 分 等 级 计算 公式 如 下 


F, = py 


一 X100 (公式 2-27) 


X10 一 60 十 5. 65 一 65. 65 


Pu 一 70 一 X10 一 70 一 4:35 一 65. 65 


PR= i i xf, | jo (从 式 2 一 28) 
公式 中 :XX 为 需要 求 出 其 百 分 等 级 的 数值 ,其 余 符号 意义 与 公式 2-25 和 公式 226 
相同 。 
[ 例 2-13] 根据 表 2-5 的 数据 列 计算 X 一 68 所 对 应 的 百 分 等 级 ， 
[ 解 】 根据 题 意 可 知 X 一 68, 处 于 *60 "数据 组 。 根 据 公式 2 - 27 可 得 ， 
(68— 60) 











1 十 XX ek 
— 5 一 一 13 十 4 3 下 49.6 -一 外 
PR= 120 * 100 Tan 52, 17 
或 根据 公式 2- 28 可 得 ; 
tn 
PR 一 Re 10 a 
120 


| 
所 以 ,与 68 对 应 的 百 分 等 级 是 52. 17, 即 在 52. 17 师 处 。 


第 五 节 SPSS 数据 文件 的 建立 与 编辑 
SPSS 对 数据 的 处 理 是 以 变量 为 前 提 的 ,因此 下 而 先 介绍 定义 变量 ,输入 数据 ,再 介 
绍 保 存 数据 ,操作 数据 文件 等 。 


启动 SPSS 后 ;出现 如 图 2-7 所 示 数 据 编 加 窗口 。 由 于 目前 还 没有 输入 数据 ,因此 
显示 的 是 一 个 空 文件 。 
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图 2-7 SP83 数据 编辑 器 示意 图 [数据 视 窗 | 
输 大 数据 前 首先 要 定义 变量 , 即 定义 变量 名 .变量 类 型 .变量 长 度 4 小 数位 数 ) .变量 
标 获 (或 值 标 答 ) 和 变量 格式 ， 


区 闪避 


EF 


面 防 五 夯 昕 悚 


aa 洱 疼 


全 ,三 


单 击 数据 编辑 窗口 左下 方 的 “Variable View" 标 签 或 双击 列 的 题 头 (Var), 进 入 如 图 
8 所 示 的 变量 定义 窗口 ,在 此 窗口 中 即 可 定义 变量 。 


上 
PE 





图 之 一 名 SP33 数据 编辑 下 示意 图 [变量 规 窗 | 


(一 ) 变量 的 定 冯 信息 
该 窗口 的 每 一 行 代表 一 个 变量 的 定 交 信息 ,包括 Name, Type, Width, Deecimal 1a- 


bel Values ,Missing, CeolumnsiAlign, Neasure 等。 


基 。 


十， 


1 . 定 作 杰 晤 音 Name 

SPSS 默认 的 变量 为 Yar0000] ,Var60002 和 等。 用户 也 可 以 根据 自己 的 需要 来 命名 变 
SPSS 变量 的 盖 名 和 一般 的 编程 语言 一 样 ,有 一 定 的 命名 规则 ,具体 内 容 如 下 : 

1) 变量 名 必须 以 字母 .汉字 或 字符 可 开头 ,其 他 字符 可 以 是 任何 字母 .数字 或 、 
#, 串 等 符 导 。 

(2) 变量 最 后 一 个 字符 不 能 是 句号 ， 

(3) 变 基 名 总 长 度 不 能 超过 8 个 字符 ( 即 4 个 汉字 )。 

(4) 不 能 使 用 空白 字符 或 其 他 特殊 字符 (如 “1”"、“?" 等 )， 

(5) 在 一 个 数据 文件 中 ,变量 命名 必须 唯一 , 乎 能 有 两 个 相同 的 变量 当 。 

(6) 在 SPSS 中 不 区 分 大 小 写 , 例 如,HXH.hxh 或 Rxh 对 SPSS 而 言 , 均 为 同一 变 


时 镍 称 ， 


(7) SPSS 的 名 法 系统 中 表达 迎 辑 关系 的 字符 捉 不 能 作为 变量 的 和 名称; 如 ALL.、 


AND, WITH.OR 等 。 





2. 古 尺 可 雷 类 型 Type 

单 击 Type 相应 单元 中 的 按钮 ,出 
现 如 图 3 一 9 所 示 的 对 话 框 ,在 对 话 框 
中 选择 合适 的 变量 类 型 并 单 击 OK 按 
钮 ,其 可 定义 变量 类 型 。 

a 人 SPSS 的 常用 变量 类 型 如 下 : 
Re 人 人 el 1 y ' | (1) Numeric: 数 值 型 。 定 义 栏 席 
-一 一 一 -一 一 teolumns} 和 数值 宽度 CWidth) 即 “ 整 
半 名 -9 变量 美 型 定义 对 请 框 数 部 盆 十 小 数 吉 十 小 数 部 分 "的 位 数 ， 


-一 全 
项 LE 


默认 胃 8 位; 定 交 小 数位 数 (Decimal Elacesy ,对 认为 二 位 。 

[2) Comma: 加 显 逗 号 的 数值 型 , 即 整 数 部 分 每 3 位 数 加 一 逗号 ,其 余 定义 方式 同 数 
值 型 ,也 需要 定义 数值 的 宽度 和 小 数位 数 ， 

Cy Scientific notation: 科 学 记 数 型 ; 同时 定义 数值 宽度 Cwidth} 和 小 数位 数 (Deci- 
mal) ,在 数据 编辑 窗口 中 以 指数 形式 显示 。 如 ,将 栏 宽 和 数值 宽度 均 定义 为 9. 小 数位 数 
为 2 时 ,345.678 在 数据 表 就 显示 为 3. 46E 十 02， 

(4) Custom curreney; 用 户 自 定义 型 ,如 果 没 有 定义 , 则 默认 显示 为 整数 部 分 每 3 位 
加 一 逗号 。 用 户 可 定义 数值 宽度 和 小 数位 数 。 如 12345. 678 显示 为 12,345. 678。 

(5) String; 字 符 型 ,用 户 可 定义 字符 长 度 (Characters) 以 便 输 入 字符 ， 

3. 不 量 长 厌 Width 

设置 变量 的 长 度 , 当 变量 为 日 期 型 时 无 效 。 

4. 杰 量 小 数 点 此 数 Decimal 

设置 变量 的 小 数 点 位 数 , 当 变 量 为 日 期 型 时 无 效 。 

5. 过 量 不 元 Label 

变量 标签 是 对 变量 名 的 进一步 说 明 或 注释 ,变量 只 能 由 不 超过 8 个 字符 组 成 ,而 8 
个 字符 经 带 不 足以 说 清楚 变量 的 含义 。 而 变量 标签 可 长 达 120 个 字符 ,可 显示 大小 写 ， 
需要 时 可 人 异 此 对 变量 名 的 会 义 进 行 较为 清晰 地 解释 。 

6. 变量 蓝本 蕉 Vialues Labels 

变量 值 标签 是 对 变量 的 每 一 个 可 能 取 值 的 进一步 描述 。 当 变量 基 称 名 变量 或 顺序 
变量 时 ,这 是 非常 有 用 的 。 例如 ,在 统计 中 经 常用 不 同 的 数字 代表 被 试 的 性 别 是 男 或 女 ; 
被 试 的 职业 是 教师 .警察 ,还 是 公务 员 ; 被 试 的 教育 程度 是 高 中 以 下 ,还 有 本 科 、 硕 士 , 博 
士 等 信息 ,。 为 避 锡 以 后 对 数字 所 代表 的 娄 别 发 生 遗 忘 , 就 可 以 使 用 变量 值 标签 加 以 说 明 
和 记录 。 比 如 用 1 代表 “male”( 男 ) ,2 代表 "female"( 女 ), 其 设置 方法 为 : 单 击 values 相 
应 单元 ,出 现 如 图 2-10 所 示 的 对 话 框 ;在 第 一 个 Value 立 本 框 内 输 具 1 在 第 二 个 Walue 
文本 框 内 输入 “male"; 单 击 Add 按钮 ,再 重复 这 一 过 程 完成 变量 值 2 的 标签 ,就 完成 了 该 
变量 所 有 可 能 取 值 的 标签 的 添加 。 





图 2= 坦 次 量 导 妹 签 定 必 对 语 框 
7 . 灾 量 的 量 元 路 度 Columns 
输入 变量 的 显示 宽度 ,默认 为 8。 
8. 过 量 的 测量 民居 Measure 
前 一 章 已 经 介绍 ,变量 按 测 量 水 平 可 被 划分 为 称 名 变量 ,顺序 或 等 级 变量 ,等 距 变 量 
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默认 胃 8 位; 定 交 小 数位 数 (Decimal Elacesy ,对 认为 二 位 。 

[2) Comma: 加 显 逗 号 的 数值 型 , 即 整 数 部 分 每 3 位 数 加 一 逗号 ,其 余 定义 方式 同 数 
值 型 ,也 需要 定义 数值 的 宽度 和 小 数位 数 ， 

Cy Scientific notation: 科 学 记 数 型 ; 同时 定义 数值 宽度 Cwidth} 和 小 数位 数 (Deci- 
mal) ,在 数据 编辑 窗口 中 以 指数 形式 显示 。 如 ,将 栏 宽 和 数值 宽度 均 定义 为 9. 小 数位 数 
为 2 时 ,345.678 在 数据 表 就 显示 为 3. 46E 十 02， 

(4) Custom curreney; 用 户 自 定义 型 ,如 果 没 有 定义 , 则 默认 显示 为 整数 部 分 每 3 位 
加 一 逗号 。 用 户 可 定义 数值 宽度 和 小 数位 数 。 如 12345. 678 显示 为 12,345. 678。 

(5) String; 字 符 型 ,用 户 可 定义 字符 长 度 (Characters) 以 便 输 入 字符 ， 

3. 不 量 长 厌 Width 

设置 变量 的 长 度 , 当 变量 为 日 期 型 时 无 效 。 

4. 杰 量 小 数 点 此 数 Decimal 

设置 变量 的 小 数 点 位 数 , 当 变 量 为 日 期 型 时 无 效 。 

5. 过 量 不 元 Label 

变量 标签 是 对 变量 名 的 进一步 说 明 或 注释 ,变量 只 能 由 不 超过 8 个 字符 组 成 ,而 8 
个 字符 经 带 不 足以 说 清楚 变量 的 含义 。 而 变量 标签 可 长 达 120 个 字符 ,可 显示 大小 写 ， 
需要 时 可 人 异 此 对 变量 名 的 会 义 进 行 较为 清晰 地 解释 。 

6. 变量 蓝本 蕉 Vialues Labels 

变量 值 标签 是 对 变量 的 每 一 个 可 能 取 值 的 进一步 描述 。 当 变量 基 称 名 变量 或 顺序 
变量 时 ,这 是 非常 有 用 的 。 例如 ,在 统计 中 经 常用 不 同 的 数字 代表 被 试 的 性 别 是 男 或 女 ; 
被 试 的 职业 是 教师 .警察 ,还 是 公务 员 ; 被 试 的 教育 程度 是 高 中 以 下 ,还 有 本 科 、 硕 士 , 博 
士 等 信息 ,。 为 避 锡 以 后 对 数字 所 代表 的 娄 别 发 生 遗 忘 , 就 可 以 使 用 变量 值 标签 加 以 说 明 
和 记录 。 比 如 用 1 代表 “male”( 男 ) ,2 代表 "female"( 女 ), 其 设置 方法 为 : 单 击 values 相 
应 单元 ,出 现 如 图 2-10 所 示 的 对 话 框 ;在 第 一 个 Value 立 本 框 内 输 具 1 在 第 二 个 Walue 
文本 框 内 输入 “male"; 单 击 Add 按钮 ,再 重复 这 一 过 程 完成 变量 值 2 的 标签 ,就 完成 了 该 
变量 所 有 可 能 取 值 的 标签 的 添加 。 





图 2= 坦 次 量 导 妹 签 定 必 对 语 框 
7 . 灾 量 的 量 元 路 度 Columns 
输入 变量 的 显示 宽度 ,默认 为 8。 
8. 过 量 的 测量 民居 Measure 
前 一 章 已 经 介绍 ,变量 按 测 量 水 平 可 被 划分 为 称 名 变量 ,顺序 或 等 级 变量 ,等 距 变 量 
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和 等 比 变量 几 种 . 这 里 可 根据 测量 量 表 的 不 同 水 平 设 置 对 应 的 变 时 测量 尺度 ,设置 方式 
为 : 称 名 变量 选择 Nominal; 顺序 或 等 级 变量 选择 Ordinal; 等 距 或 等 比 变量 均 选 择 Scale, 


(二 ) 变量 定义 信息 的 复制 

如 朵 有 凶 个 变量 的 类 型 相同 ,可 以 先 定义 一 个 变 基 ,然后 把 该 变量 的 定义 信息 复制 
给 其 他 类 型 相同 的 变量 。 具 体操 作为 ; 先 定义 好 一 个 变量 ,在 该 变量 的 行 号 上 单 击 圳 键 ， 
在 弹出 的 快捷 菜单 中 选择 "copy" 命 令 , 然 后 选 样 其 他 同类 型 变量 所 在 行 , 单 击 鼠 标 右 键 . 
在 弹出 的 快捷 荣 单 中 选择 "Paste”"。 这 样 就 复制 了 同样 的 变量 定义 信息 争 一 个 新 的 变量 ， 
用 户 再 根据 需要 将 自动 产生 的 新 变量 名 改 为 所 要 的 变量 名 . 


二 、 数 据 的 输入 与 保存 


(一 ) 数据 输入 的 一 般 方 法 

定义 了 所 有 变量 后 , 单 击 “Data view" 标 筠 , 即 可 在 数据 视图 中 输 人 数据。 数据 编辑 
窗口 中 黑 框 所 在 的 单元 为 当前 的 数据 单元 ,表示 用 户 正在 对 该 数据 单元 录 人 数据 或 正在 
履 改 该 单元 中 的 数据 。 因 此 ,在 录入 数据 时 ,用 户 应 首先 将 黑 框 称 至 想 要 输入 数据 的 单 
元 烙 上 。 

数据 录 人 时 可 以 逐 行 录 人 , 即 完 成 一 个 个 案 行 所 有 变量 数值 的 录 人 ,再 转 人 下 一 行 
即 下 一 个 个 案 ; 也 可 以 逐 列 录入 , 即 按照 变量 录 人 人 数据 , 录 完 一 个 变量 列 后 再 转 入 下 一 个 
变量 列 。 


(二 ) SPSS 数据 文件 的 保存 

在 录入 数据 时 ,应 及 时 保存 数据 ,防止 数据 的 于 上 失 ， 以 便 以 后 再 调用 该 数据 。 有 具体 步 
又 如 下 : 

选择 "File" 药 单 的 " Save” 命令 ,可 直接 保存 为 SPSS 默认 的 数据 文件 烙 武 Cx . SAV) 。 

选择 “File "菜单 的 "Satee Aa" 命令, 弹出 "Save Data As" 对 话 框 ,根据 自己 的 需要 指 
是 数据 文件 储存 的 路 径 和 文件 名 。 


三 、 数 据 文 件 的 编辑 与 转换 


经 过 变量 定义 与 数据 的 录入 ,初期 的 数据 文件 即 可 建成 。 但 在 后 续 的 数据 分 析 过 程 
中 ,常常 需要 对 数据 文件 进行 多 方面 的 修订 ,编辑 与 变换 。 我 们 选择 其 中 节 为 常用 的 哥 
作 给 予 简明 地 介绍 ， 


(一 ) 数据 的 编辑 

1. 塘 加 和 和 硼 悦 一 个 个 罕 

研究 者 经 常 需要 在 某 个 个 案 前 面 或 后 面 插入 新 的 个 案 。 例 如 要 在 第 5 个 观察 单位 
前 增加 一 个 观察 单位 ( 即 在 第 6 行 前 增加 一 行 ,使 原来 的 第 6 行 下 移 成 为 第 7 行 )。 可 先 
激活 第 6 行 的 任 一 单元 格 ,然后 选择 “Data" 革 单 中 的 *Insert Cases" 命 令 , 系 统 自动 在 第 6 
行 前 插入 一 个 新 的 行 , 原 第 6 行 自动 下 移 一 行 成 为 第 7 行 。 然 后 把 新 增 个 案 的 各 个 变量 
值 输 人 相应 的 单元 格 。 


如 要 删除 第 9 行 ( 即 删除 这 个 个 案 的 所 有 观察 值 ), 则 可 上 先 单 击 第 9 行 的 行头 ,这 时 
尾 个 第 9 行 被 选中 ( 呈 黑 底 白 字 状 ) ,然后 按 Delete 键 或 选择 "Edit" 荣 单 中 的 Clear 命令 ， 
该 行 即 被 删 际 。 

2 . 工 万 讲 肉 序 

在 数据 交 件 中 ,可 根据 一 个 或 多 个 排序 变量 的 值 , 重 排 个 案 的 顺序 。 选 择 "Data" 闷 
单 的 "Sort Cases”" 命 令 , 弹 出 对 话 框 ,如 图 211 所 未 。 





图 2-11 根 纪 变量 导出 个 案 重 电 排 序 对 证 杠 


在 变量 名 列表 框 中 选择 1 个 需要 按 其 数值 大 小 排序 的 变 基 (也 可 选 多 个 变量 ,系统 
将 按 变 量 选择 的 先后 逐 级 依次 排序 ), 单 击 图 中 *“ 国 加 " 技 钮 使 之 添加 到 ”Sort by" 框 中 , 然 
后 在 "Sort order" 框 中 选择 是 按 升序 (Ascending, 从 小 到 太 }) 还 是 降序 (Descending, 从 大 
到 小 } 排 列 , 单 击 OK 钮 即 可 ， 


3. 六 凌 个 第 子 药 
在 数据 统计 中 可 从 所 有 资料 中 选择 部 分 数据 进行 统计 分 析 。 选 择 *Data" 葬 单 中 的 
“Select Cases”" 命 令 , 弹 出 对 话 框 ,如 图 2- 12 所 示 。 通 过 单 击 该 对 话 框 上 和 不同 的 按钮 ,可 
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图 ~ 12， 选 桂 个 案子 集 对 语 栓 
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以 确定 用 不 同 的 方式 对 个 案 进行 选择 。 系 统 提 供 的 选择 方式 有 五 种 ,但 是 常用 的 主要 有 
如 下 两 种 : 

(1 Al cases; 选 择 所 有 的 个 案 ( 行 ) ,该 选项 可 用 于 解除 先前 的 选择 

(2) If eondition is satisfied; 按 指定 茶 件 选择 。 单 击 全 按钮 ,弹出 Select Cases;:If 对 
话 框 , 先 选择 变量 ,然后 定 闵 亲 件 ， 

定义 完成 后 ,还 要 确定 未 被 选择 个 案 的 处 理 方式 。 主 对 话 枢 给 出 两 个 选择 , "Fil- 
tered"( 过 滤 ) 和 “Deleted”( 删 除 )， 如 果 选 择 了 "Deleted”, 则 数据 文件 中 和 将 只 保留 被 选择 
的 那些 个 案 ,那些 未 被 选择 的 个 案 将 被 删除 . 不 过 ,人 研究 者 通常 选择 "Filtered" 方 式 , 将 未 
租 选 择 的 个 案 暂 时 过 泸 掉 ,但 仍 将 这 些 个 案 保留 在 数据 文件 里 ,以 便 这 些 个 案 还 可 以 参 
与 后 续 的 其 他 统计 分 析 。 系 统 默认 方式 也 是 "Filtered”， 

4 数 拇 的 录 症 蕊 出 

用 户 还 可 以 按 指定 变量 的 数值 对 数据 交 件 中 其 他 变量 的 数据 进行 归 类 分 组 汇总 ， 
例如 要 了 解 不 同性 别 的 同学 的 语文 平均 成 绩 , 需 要 首先 按 性 别 对 数据 进行 分 类 ,然后 分 
别 计算 出 男 同学 和 玄 同 学 各 自 的 平均 成 绩 。 在 SPSS 中 ,实现 数据 文件 分 类 汇总 需要 三 
个 步 野 :一 ,指定 分 类 变量 和 汇总 变量 ,二 ,计算 机 根据 分 类 变 量 的 夺 干 个 不 同 取 值 将 个 
案 数 据 分 成 若干 类 ,并 对 每 类 个 案 计 算 汇 总 变量 的 描述 性 特征 量 ;三 .将 分 类 汇总 计算 结 
果 保 存 到 一 个 文件 中 。 主 要 通过 以 下 步骤 实现 ， 

(1) 选择 "Data "菜单 中 的 “Aggregate” 靖 他 ,弹出 对 话 框 ， 

(2) 在 变量 名 列表 框 中 选择 分 类 变量 ,比如 "性 别 ", 使 之 进入 "Break Variables* 框 中 。 

(3) 在 变量 名 列 表 框 中 选择 汇总 变量 ,例如 “语文 "变量 ,使 之 进 人 “Aggregate Wari- 
ables" 框 。 国 为 窜 求 语 立 成 绩 的 平均 值 , 故 单 击 "Funection… "按钮 ,弹出 *Apggregate Da- 
ta: 太 gEregate Function" 对 话 框 。 选 择 *Mean of values” ,然后 单 击 "Continue" 按 和 馈 返 回 . 
分 组 汇总 提供 的 函数 形式 达到 二 十 几 种 ,但 是 常用 的 主要 有 以 下 几 种 :Mean, 计 算 各 类 或 
各 组 的 平均 值 ;Sum, 计 算 各 类 或 组 所 有 观察 值 的 总 和 ;Standard deviationy 计算 各 类 或 各 
组 的 标准 差 ;Unweighted, 统 计 各 类 或 组 的 个 案 数 . 

(4) 指定 分 类 汇总 保存 路 径 。 如 果 用 户 不 专门 指定 汇总 数据 的 储存 路 径 与 文件 名 ， 
则 系统 默认 路 径 与 当前 数据 文件 储存 路 径 相 同 , 上 且 以 "Aggr, sav" 文 件 各 储存 ， 


(二 ) 变量 的 操作 

1 . 增加 和 和 机 屎 一 个 杰 叔 

增加 一 个 变量 , 即 增加 一 个 新 的 列 。 使 用 下 面 两 种 方法 都 很 容易 实现 这 一 目的 ， 

菜单 操作 法 。 例 如 要 在 第 2 列 前 增加 一 个 新 的 列 ,使 原来 的 第 2 列 右 移 变 成 第 3 列 ， 
可 先 激 活 第 2 列 的 任 一 单元 格 , 然 后 选择 *Data" 菜 单 中 的 “Insert variable” 项 , 则 系统 自 
动 为 用 户 在 第 2 列 前 插 人 一 个 新 的 变量 列 , 原 第 2 列 自动 向 右 移 一 到 成 为 第 3 到 。 

选中 某 列 法 。 要 在 第 2 列 前 增加 一 个 新 的 列 , 先 单 击 第 2 到 的 列 头 ,这 时 整个 第 2 列 
租 选 中 ( 呈 黑 底 白 字 状 ), 单 击 刀 标 右键 ,在 其 右键 快捷 菜单 中 选择 “Insert Variable" 项 ， 
系统 自动 为 用 户 在 第 2 列 前 插 人 一 个 新 的 变量 列 , 原 第 2 列 自动 右 称 一 列 成 为 第 3 列 。 

删除 一 个 变量 , 即 刷 除 一 列 数据 ， 其 方法 和 上 面 的 增加 一 个 变量 相对 应 。 例 如 要 出 
除 第 5 个 变量 列 , 可 先 单 击 第 5 列 的 列 头 ,这 时 整个 第 5 列 被 选中 (时 黑 底 自 字 状 ), 然 后 


接 Delete 键 或 选择 "Edit" 菜单 中 的 "Clear 古村 ,或 者 单 击 也 标 右 链 , 在 其 快捷 菜单 中 选 
择 "Clear" 项 ,该 列 即 被 删 陈 。 

2. 蘑 信 加 起 琶 鹿 

在 实际 的 统计 中 ,经 常 需要 计算 数据 的 加 权 平 均 数 ， 例 如 ,希望 了 解 某 超市 一 天 此 出 
商品 的 平均 价格 。 如 果 似 以 各 种 商品 的 单价 平均 数 作 为 平均 价格 显 热 是 不 合理 的 ,还 应 考 
虚 各 商品 的 销售 数量 对 平均 价格 的 影响 。 因 此 ,以 商品 的 销售 量 作为 权重 计算 各 种 商品 单 
价 的 加 权 平 均 数 才 是 我 们 需要 的 结果 ,在 SPSS 过 程 中 就 需要 将 商品 销售 数量 作为 加 权 变 
量 。 操 必 方 法 是 选择 "Data" 菜 单 中 的 "Weight Cases" 命 令 , 出 现 如 图 2 一 13 所 未 的 对 话 框 ， 


WO LE 





图 2=13 指定 加 朴 变 量 的 对 请 框 


其 中 心 Do not weight cases" 项 表示 不 刁 如 权 , 这 可 用 于 取消 加 权 ;*Weight cases 
by "项 表示 选择 1 个 变量 做 加 权 。 在 加 权 换 作 中 ,系统 只 对 数值 变量 进行 有 效 如 权 , 即 大 
于 的 数 按 变量 的 实际 值 加 权 ,:0. 负 数 和 缺失 值 加 权 为 0， 

3. 规 达 已 育 杰 扭 恒 立新 亚 量 

在 数据 统计 分 析 中 ,有 时 候 需 要 通过 数据 转换 来 提示 变量 之 间 的 真实 其 系 。 这 时 需 
要 通过 对 已 既 疗 在 的 变量 进行 处 理 , 从 而 生成 新 的 变量 ， 

操作 过 程 是 选择 "Transform "菜单 中 的 “Compute" 项 ,打开 如 图 2 -14 所 示 的 的 对 话 框 。 

在 对 话 框 的 "Target Variable" (目标 变量 ) 框 中 输 炎 变量 名 ,目标 变量 可 以 是 现存 变 





图 2= 址 异 丁 于 Compule 产生 新 弯 量 的 对 语 杠 


CTT Ne | 并 





TT EY ee 





量 或 新 变量 然后 在 “Mumerie Expression" (数值 表达 式 ) 框 中 输 人 计算 目标 变量 值 的 表 
达 式 。 表 达 式 中 能 够 使 用 堪 下 框 中 列 出 的 现存 变量 名 .计算 器 板 列 出 的 等 术 运 算 符 .党 


数 ,“Funetions"”“ 函 数 ) 列 表 框 中 给 出 了 70 多 个 函数 ,可 用 于 对 目标 变量 计算 式 的 编辑 。 


4. 产生 从 绍 亚 量 

在 统计 过 程 中 ,往往 需要 对 某 个 连续 变量 进行 分 组 ,使 其 变 成 离散 的 组 别 变 量 。 如 
对 于 某 谋 程 成 绩 , 可 以 规定 90 以 上 是 A 等 ,80 一 和 是 HBH 等 ,70 一 有 0 是 已 等 ,60 一 70 是 了 D 
等 ,小 于 的 是 下 等 ,这 时 候 就 需要 将 成 绩 变 成 离散 的 组 别 变量 ， 

调用 SPSS 中 的 "Transform”" 药 单 的 “Categorize Variables" 靖 令 可 以 实现 这 个 功能 ， 
程序 将 会 产生 新 的 变量 , 包 舍 分 组 结果 。 具 体 的 操作 过 程 是 ,选择 *Transform” 荣 单 的 
“Categorize Variables "命令 ,弹出 相应 的 对 话 框 。 在 左边 的 变量 列表 框 中 选 定 一 个 用 于 
分 组 的 连 绿 变 基 ,将 其 称 动 到 右边 的 “Create Categories" 杠 中。 在 "Number of catego- 
ries 后 的 文本 框 中 输 人 要 分 成 的 组 别 数 ,系统 会 自动 生成 一 个 新 的 变量 ,其 变量 各 是 
“n 十 原 变量 名 ”, 该 变量 用 于 保存 各 个 案 被 分 配 到 的 组 别 数 。 如 用 于 分 组 的 变量 是 
“math” ,那么 产生 的 分 组 变量 名 就 是 *nmath”。 

5, 芋 苗 有 租 重 新 层 兽 

用 户 可 对 个 案 的 某 个 变量 重新 赋值 ,此 操作 只 适用 于 数值 变量 。 方 法 是 先 选择 
“Transform" 沫 单 中 的 “Recode" 项 ,此 时 有 两 种 选择 :一 种 是 对 变量 自身 重新 冉 值 即 
“Into Same Variables" 产生 的 新 变量 值 覆 盖 原 有 变量 悄 , 另 一 种 是 赋值 到 其 他 变量 或 新 
生成 的 变量 即 "Into Different Variables" ,产生 的 新 变量 值 以 另 一 个 变量 名 保存 。 通 常 为 
了 保留 原 变 量 的 信息 而 倾向 于 选择 第 二 种 方法 ,弹出 如 图 z - 15 所 示 的 “Recode Into Dif- 
[erent Wariables” 对话 框 ， 

先 在 变量 和 名 列表 中 选择 1 个 或 多 个 变量 ,使 之 添加 到 “Numeric Variable— outpui 
Variable" 框 中 ,同时 在 "Output variable" 框 中 确定 新 变量 名 和 标签 (可 以 是 堪 侧 列 表 中 已 
有 的 变量 ,也 可 以 是 用 户 重新 定义 的 新 变量 名 ) , 单 击 *Change" 确 认 。 





图 2= 钙 异 防 于 重新 赋值 产生 新 蛮 量 的 对 话 杠 


然后 单 击 "Dld and New Values… "按钮 ,弹出 如 图 2- 15 所 示 的 对 话 框 。 用 户 根据 
实际 情况 确定 旧 值 和 新 值 , 单 击 *Continue" 按 钮 返回 上 一 画面 ,再 单 击 "OK" 按 钮 即 可 。 

在 数据 文件 的 编辑 与 转换 功能 中 ,还 有 一 些 命令 也 是 很 有 用 的 ,可 以 为 数据 分 析 带 
来 便利 。 比 如 *Data" 荣 单 中 的 “Transpose" 合 令 可 以 实现 数据 编辑 器 中 数据 的 行 与 列 互 





图 2~16 变量 得 新 蔷 值 时 新 变量 簿 定义 对 话 杠 
换 ;*Merge Files” 命 令 可 以 将 两 个 符合 一 定 要 求 的 文件 合并 成 一 个 文件 ;“Transform" 菜 
单 中 的 "Count” 命 令 可 以 产生 一 个 计数 变量 ,以 反映 各 个 个 案 符合 若干 规定 条 件 中 的 儿 
项 。 此 处 不 再 对 这 些 命令 的 使 用 进行 介绍 ,需要 的 用 户 可 以 直接 点 击 相应 命令 打开 对 话 
框 ,按照 对 话 框 的 提示 能 够 很 容易 完成 相应 操作 。 


山上 1 淆 


第 六 节 “描述 性 特征 量 计算 的 SPSS 过 程 


有 了 上 一 节 关 于 SPSS 数据 文件 建立 与 编辑 的 基础 之 后 ,我 们 就 可 以 将 大 部 分 的 研 
究 资料 录 人 计算 机 ,生成 可 以 进行 统计 分 析 的 SPSS 数据 文件 。 而 统计 分 析 中 最 基础 的 
部 分 当然 是 描述 性 特征 最 的 计算 。 


一 、Descriptive 过 程 


利用 SPSS 软件 ,对 一 组 数据 进行 描述 性 统计 量 或 特征 量 的 计算 是 一 个 很 简单 的 
过 程 ,众多 的 特征 量 几 乎 可 以 通过 一 个 对 话 框 就 可 完成 。 县 体操 作 基 选择 "Analyze” 某 
单 中 的 “Descriptive Statistics”, 然 后 单 击 "Deseriptive”( 如 图 2 一 17a 所 示 ), 打开 如 
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图 2-17b 所 示 的 描述 性 统计 分 析 的 主 对 话 框 。 从 对 话 框 左边 的 变量 列表 中 选择 一 个 或 
多 个 要 进行 分 析 的 变量 ,点 击 " 国 加 "按钮 将 选中 变量 置信 右边 的 变量 框 中 。 如 果 要 计算 
各 个 个 案 在 这 些 变 量 上 所 得 观测 结果 的 标准 分 , 则 勾 选 对 话 框 左下 角 的 “Save standard- 
ized values as variables" 命 令 , 系 统 会 自动 计算 各 变量 的 标准 分 ,并 以 “z 十 原 变 量 名 ”的 变 
量 名 将 计算 结果 存 人 数据 编辑 器 中 。 例 如 ,要 求 系统 计算 变量 *math” 的 标准 分 ,系统 就 
会 在 数据 文件 中 生成 一 列 变量 名 为 *zmath” 的 标准 分 数据 。 这 一 列 标准 分 数 有 正 .有 人 负 ， 
而 且 还 有 小 数 , 如 果 需 要 进行 线性 转换 以 消除 负 号 和 小 数 点 ,可 以 使 用 前 述 的 “Compute” 
命令 来 完成 诸如 *Z'= 二 A，Z 十 B”( 如 =10。2 十 50) 一 类 的 转换 。 

接着 , 单 击 对 话 框 上 的 “Options…" 按 钮 打开 如 图 2 - 18 所 示 的 对 话 框 。 对 话 框 上 有 
一 系列 描述 性 统计 特征 量 的 选择 框 ,其 中 平均 数 (mean) ,标准 差 (Std. deviation) 的 默认 
状态 就 是 被 勾 选 的 ,用 户 可 以 根据 计算 的 需要 勾 选 。 一 般 , 在 描述 性 统计 分 析 中 ,常常 需 
要 计算 的 特征 量 是 平均 数 ,总 和 (Sum) ,标准 差 、 方 差 (Variance) ,全 距 (Range) ,最 小 值 
{ Minimum) 和 最 大 值 (Maximum)。 





2-18 撕 述 性 特征 量 选 项 对 话 框 


色 选 完成 后 , 单 击 "Continue” 按 钮 返回 上 一 个 主 对 话 框 ,然后 单 击 *"OK” 按 钮 即 可 输 
出 所 需要 的 描述 性 特征 量 计算 结 果 ， 


二 、Frequences 过 程 


上 述 描述 性 统计 基 的 计算 大 部 分 还 可 以 通过 "Frequences…?” 命 令 来 完成 ,其 程序 与 
“Desecriptive ”过程 相似 :选择 “Analyze” 菜 单 中 的 “Descriptive Statistics”; 然 后 单 击 “Fre- 
quences "打开 Frequences 的 主 对 话 框 ;从 对 话 框 左边 的 变量 列表 中 选择 一 个 或 多 个 要 进 
行 分 析 的 变量 ,点击 " 恕 中 "按钮 ,将 选中 变量 置 入 右边 的 变量 框 中 。 如 果 要 计算 各 个 变量 
值 在 数据 列 中 出 现 的 次 数 , 则 需要 勾 选 对 话 框 左下 角 的 “Display Frequeney Tables" 命 
令 , 系 统 会 输出 一 个 变量 值 的 频数 分 布 表 ;接着 单 击 对 话 框 上 的 “Statistics… "按钮 ,就 可 
以 打开 如 图 2 - 19 所 示 的 对 话 框 。 
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图 荆 - 雪 ， 炳 数 分 布 分 析 的 特征 是 选 顶 对 话 杠 


如 果 需 要 ,利用 这 一 对 话 框 ,也 可 以 得 到 平均 数 , 总 和 ,标准 差 , 方 差 , 全 距 . 最 大 值 和 第 
最 水 值 的 计算 缚 果 , 同 时 还 可 以 歼 得 众 数 (Mode) .中 位 数 CMedian) .四 分 位 数 ! 选 中 


这 
Quartiles} 等 的 计算 铺 困 。 


妇 果 需要 计算 其 他 的 百 候 位 数 , 则 可 以 在 “Percentiles" 命 令 前 的 方 框 中 打 名 ;激活 其 ” 揭 
后 面 的 方 枢 , 填 人 所 需要 计算 的 百 分 位 数 对 应 的 百 分 等 级 ;然后 单 击 "Add" 将 其 加 载 到 方 图 


框 中 ,该 方 框 可 以 加 载 许 包 个 百 分 等 级 数 ; 然 后 单 击 "Continue" 返 回 上 一 层次 的 对 话 框 ; - 
再 单 击 "OQK” 即 可 得 到 所 需要 的 描述 性 特征 量 和 要 求 其 计算 的 百 分 位 数 。 pe 
和 

一 二 一 复习 思考 与 练习 题 = 一 

时 Pp a 

1. 资料 分 类 的 两 个 原则 是 什么 ? : 


2. 举例 说 明 如 何 才能 保证 资料 分 类 标准 的 单 向 性 ? 

3, 斌 比较 条 形 图 与 直方 图 的 异同 。 

1. 分 别 就 下 列 三 组 数据 计算 其 平均 数 .中 位 归 , 你 数 和 标准 差 , 并 思考 各 组 数据 更 适 

dt 

CY 011082 105dr7 :10 

(a) 96587779.9+1] 

(3) 121,.7,656,.6,.5,3:2 

5. 现 有 8 认同 学 大 如 类 语源 斌 的 服 拓 办 天 27 下 全 人 和 i 

(1) 计算 其 算术 平均 数 ; 

(2) 给 每 个 数 加 上 5, 再 计算 它们 的 算术 平均 数 ; 

(3) 给 每 个 数 冬 以 5, 再 计算 它们 的 算术 平均 数 : 

(4) 根据 以 上 各 小 题 计算 结果 可 以 得 出 什么 规律 ? 
;, 某 次 全 区 高 一 数学 统考 中 , 某 校 商 一 学 生 80 人 的 数学 统考 成 绩 次 数 分 布 如 表 
所 示 。 试 计算 这 些 学 生 玖 学 成 绩 的 算术 平均 数 . 中 位 数 . 标 准 差 :四 分 世 盖 以 及 第 


ELL 3 


70 个 百 分 位 数 。 
表 2-7 某 班 同学 数学 统考 成 绩 的 分 布 
分 组 区 间 


9 站 :一 


?= 





7. 什么 叫做 标准 分 ? 某 班 同学 语文 考试 成 绩 的 平均 分 为 65 分 ,标准 差 为 12 分 , 试 
分 别 计 算 表 2 -8 中 所 列 几 位 同学 语文 考试 成 绩 的 标准 分 ，， 
囊 2-8 几 位 同学 语文 考试 的 成 铺 


学 “号 08001 08002 08003 O8004 08005 





分 数 90 53 5 47 ?5 


3. 小 张 与 小 明 在 期 末 的 考试 成 绩 , 以 及 全 年 级 各 门 课程 考试 成 绩 的 总 体 情 况 如 表 
2-9 所 示 。 试 计算 小 张 与 小 明 各 门 课 程 的 标准 分 .标准 总 分 ;考试 原始 分 数 的 总 和 。 比 
较 这 两 位 同学 标准 总 分 .原始 总 分 的 高 低 ,并 说 明 期 未 考试 总 成 绩 的 年 级 排名 依据 哪 一 





总 分 更 合理 . 
表 2-9 小 张 .小 明 及 年 级 考试 情况 (各 门 课程 满分 100) 
科 目 年 级 平均 分 年 缀 分 标准 蔷 小 张 分 数 小 明和 从 数 
语 冯 30 5 a0 70 
数 学 站 2 7 B80 $0 
莫 语 a0 0 中 
物 理 65 6 55 7 
化 学 60 8 65 on 
历 史 和 el 75 
地 理 石 吕 7 Fo B65 





3. 下 面 的 数据 均 为 标准 Z 分 数 。 试 将 该 组 分 数 转 撞 为 平均 分 为 50 标准 差 为 10 的 
| 工分 数 , 或 者 转换 为 平均 分 为 10 .标准 差 为 3 的 标准 分 数 ， 


ZZ 一 2,50 一 1 的 tt50 O00 1.00 2.00 2.#0 
10. 百 分 等 级 与 百 分 位 数 有 什么 区 别 和 联系 ? 
11. 试 就 练习 题 4 .练习 题 5 的 数据 建立 SPSS 数据 文件 ,并 借助 于 SPSS 系统 计算 各 
数据 组 的 平均 数 .中 位 数 ,标准 差 ， 与 前 述 计算 结果 进行 比较 ,如 有 平 同 ;请 加 以 说 明 。 
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第 三 章 ” 随 机 事件 与 概率 分 布 
Ga 


具有 不 确定 性 变化 畦 果 的 现象 叫做 随机 现象 ,而 随机 现 章 的 每 一 可 能 表现 形式 盐 结 
累 都 叫做 随机 事 忻 。 统 计 学 是 通过 对 随机 事件 的 概率 分 析 来 把 握 随 机 现象 变化 规律 的 。 
本 章 简 间 介 启 交 机 事件 概率 之 和 与 概率 之 积 的 运算 规则 后 ,详细 地 讨论 了 离散 变量 和 连 
续 变 量 的 概率 分 布 特征 ,特别 是 二 项 分 布 . 正 态 分 布 的 性 质 及 其 应 用 。 二 项 分 布 可 以 有 
效 地 解决 多 重 选择 任务 的 概率 分 析 , 正 态 分 布 则 能 上 够 帮助 我 们 和 夕 容易 地 通过 标准 差 特等 
距 量 表 鼓 据 转 换 为 等 比 量 表 数 据 , 也 使 得 个 体 观 测 值 的 地 位 评估 变 得 简 扼 了 。 正 态 分 布 
规律 告诉 我 们 :使 用 不 同 测 评 工具 所 得 结果 必须 转 挽 为 标准 分 后 才能 直接 相 加 。 


第 一 章 的 “ 引 论 " 谈 到 :不 仅 因 为 心理 学 所 研究 的 几乎 都 是 随机 现象 ,而 且 测 量 过 程 
中 请 多 随机 因素 也 会 造成 数据 波动 ,所 以 心理 学 研究 要 分 析 的 数据 资料 县 有 不 确定 性 。 
或 者 ,即使 通过 一 个 数据 样本 的 描述 特征 量 , 能 够 对 样本 特征 有 所 认 知 ,但 因为 抽样 的 随 
机 性 ,也 不 能 将 样本 的 统计 量 视 为 对 总 体 和 参数 的 精确 测量 。 这 就 是 说 :我们 只 能 在 一 定 
程度 上 用 样本 统计 量 去 估计 总 体 参 数 。 对 这 种 估计 的 把 握 度 进行 分 析 , 必 须 先 理解 随机 
现象 的 运动 规律 ， 本 章 所 介绍 的 概率 及 其 分 布 特点 ,就 是 关于 随机 现象 的 运动 规律 的 ， 
它们 也 是 用 样本 推断 总 体 的 基础 。 


第 一 节 ”随机 事件 及 其 概率 


一 、 随 机 现象 和 随机 事件 


(一 ) 随机 现象 

在 心理 学 研究 中 ,通过 实验 .问卷 调 查 所 获得 的 数据 , 常 因 主 试 . 被 试 , 施 训 条 件 等 因 
泰 的 随机 变化 而 呈现 出 不 确定 性 。 即 使 是 相同 的 被 试 在 相同 的 观测 条 件 下 ,多 次 重复 测 
量 的 结果 也 还 是 上 下 波动 的 ,所 以 我 们 一 般 都 无 法 事先 确定 每 一 次 测量 的 结果 。 这 种 在 
一 定 茶 件 下 ,会 出 现 才 种 可 能 结果 的 现象 叫 随机 现象 ， 例 如 ,我 们 用 同一 届 试 仪 对 某 一 
儿童 反复 多 次 地 进行 反应 时 间 的 测试 ,得 到 的 结果 却 不 会 完全 相同 . 它 总 基 在 一 定 的 范 
围 具 上 下 波动 ， 心 理学 研究 中 所 获得 的 数据 大 才 都 具有 随机 性 ,居于 随机 现象 ， 随 机 现 
象 具 有 两 个 显著 特点 ;一 是 偶然 性 , 即 在 每 一 次 试验 之 前 ;其 结果 都 具有 不 确定 性 ;二 是 
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规律 性 , 即 在 相同 的 条 件 下 ,进行 要 次 重复 试验 ,试验 的 结果 会 呈现 出 某 些 统计 规律 ， 前 
文公 绍 过 的 投 币 游 戏 就 属于 这 种 既 具 有 随机 性 ,又 具有 规律 性 的 随机 现象 。 

为 了 探索 随机 现象 的 规律 性 ,往往 需要 对 随机 现象 反复 进行 观测 ,而 每 一 次 观测 被 
看 作 是 一 次 试验 。 如 果 一 次 试验 满足 以 下 杀人 忻 , 我 们 就 称 这 样 的 试验 是 一 个 随机 试验 ， 
简称 试验 。 即 :(1) 一 次 试验 有 和 凶 种 可 能 的 结果 ,其 所 有 可 能 结果 又 是 可 基 的 ;(2) 试 验 之 
前 乎 能 预料 哪 种 结果 会 出 现 ; (31}? 试 驻 可 以 在 相同 条 件 下 重复 进行 ， 

例如 , 投 惟 子 游 戏 就 是 一 种 随机 试验 。 屋子 有 六 个 面 ,和 首 个 面 上 的 点 数 分 别 为 1.2、 
3 和 .5.6, 所 以 每 次 抛 出 从 子 ,然后 它 落 在 和 桌面 上 ,; 朝 上 一 面 的 点 数 是 这 六 种 点 数 中 的 一 
个 ,这 是 已 知 的 或 确定 的 ,但 是 每 一 次 投 怜 子 之 前 ,是 不 能 预知 这 次 朝 上 的 点 数 是 多 少 。 
这 种 投 体 子 试验 当然 也 是 可 以 重复 很 多 次 的 ,所 以 它 是 一 种 典型 的 随机 试验 ， 


(二 ) 随机 事件 

在 随机 试验 中 研究 的 现象 都 是 随机 现象 ,随机 现象 的 每 一 种 可 能 结果 叫做 一 个 随机 
事件 ,简称 事件 。 通 常用 大 写 英文 字母 表示 。 例如 抛 硬币 试验 ,正面 朝 上 和 反面 朝 上 都 
是 随机 事件 ,可 分 别 用 字母 A、B 来 表示 。 当 然 , 有 些 事 忻 的 反面 或 否定 也 是 一 个 事件 ， 
可 用 六,B 等 表示 。 在 研究 中 ,一 般 不 单纯 考察 一 个 事 忻 ,而 是 考察 几 个 事件 以 及 它们 之 
间 的 联系 。 例 如 判断 一 个 人 的 心理 是 正常 还 是 异常 ,需要 考察 其 主客 观 的 统一 性 ,这 里 
就 会 涉及 许 才 的 随机 事件 之 间 的 美 系 问 题 。 

详细 了 解 事 件 间 的 关系 有 助 于 我 们 深刻 地 认识 事件 本 质 ,为 此 ,需要 先 把 握 以 下 三 


对 概 礼 。 
1. 面 于 查 作 与 嘉和 侣 吉他 
在 实际 生活 中 ,有 的 随机 事件 是 由 一 些 事件 集合 而 成 的 , 它 实质 上 是 一 个 随机 事件 


集 , 这 种 事件 就 叫做 复 台 事件 :有 的 事件 则 是 和 不 能 再 分 解 的 事件 ,叫做 基本 事件 .如 刚才 
所 说 的 挤 骨 子 , 其 出 现 的 点 数 为 1.2.3.4.5.6 中 的 任意 一 个 ,是 一 个 基本 事件 。 但 就 出 
现 * 侦 数 点 数 " 这 个 事件 来 说 却 是 一 个 复合 事件 ,因为 点 数 为 2.4,6 这 三 个 基本 事件 都 局 
于 “偶数 点 数 " 事 件 ,该 事件 是 三 种 基本 事件 构成 的 集合 ， 只 要 2 .4.6 这 三 个 基本 事件 中 
有 一 个 事件 发 生 ，“ 侦 数 点 数 " 这 个 事件 就 发 生 了 -。 

2, 焉 余 之 和 与 事 任 之 禾 

事件 之 和 与 事件 之 积 都 是 复合 事件 。 事件 A 和 事件 B 中 只 要 有 一 个 恬 生 ,其 构成 的 
复 涯 事件 就 发 生 了 ,这 样 的 复合 事件 叫做 站 和 B 的 事件 之 和 ;事件 A 和 事件 8B 必须 同时 
发 生 , 其 构成 的 复合 事件 才 发 生 , 这 样 的 复合 事件 叫做 4 和 互 的 事件 之 积 。 

例如 .我们 将 * 散 子 朝 上 一 面 的 点 数 基 偶数 " 记 作 事件 上 ,其 中 包含 的 三 个 基本 事件 
4 一 朝 上 一 面 的 点 数 是 2;4: = 一 朝 上 一 面 的 点 数 是 454: 一 朝 上 一 面 的 点 数 是 86。 那么 事 
件 上 4 就 是 事件 4 .As .Ai 三 者 之 和 ,可 记 为 4 一 由 十 4 十 上 。 日 常人 生活 中 ,事件 之 和 的 
例子 是 很 多 的 。 比 如 上 课 的 时 候 , 老 师 问 “有 同学 旷课 吗 ?”, 全 班 每 一 个 同学 旷课 都 是 一 
个 基本 的 随机 事件 ,而 只 要 有 一 个 同学 旷课 “有 同学 旷课 "的 事件 就 会 发 生 : 教 练 问 对 运 
动员 “今天 打 中 过 10 环 吗 ?" ,该 运动 员 在 一 天 的 练习 中 ,每 打 中 一 个 10 环 都 是 一 个 基本 
的 随机 事件 ,而 只 要 有 一 枪 打 中 ,* 打 中 过 10 环 " 就 发 生 了 。 


百 以 投 体 子 游 戏说 明 事 忻 之 积 的 概念 。 投 毛 三 次 恰 子 ,我 们 将 "三 次 打 子 朝 上 一 面 
pT LE) 
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的 点 数 都 是 6*” 记 作 事 件 BB, 其 中 包含 的 三 个 基本 事件 BB 二 第 一 次 朝 上 一 面 的 点 数 是 6; 
B;= 二 第 二 次 朝 上 一 而 的 点 数 是 61B,= 二 第 三 次 朝 上 一 面 的 点 数 是 6。 那 又 事件 B 就 是 事 
件 B.B;.B; 三 者 之 程 ,可 记 为 B8=B," B,* B;。 日 常生 活 中 ,事件 之 积 的 例子 也 和 银 多 ， 
比如 "一 个 都 不能 少 "必须 是 每 “一 个 同学 都 不 能 缺少 "的 事件 都 发 生 才 行 。 

3. 互 不 检 距 焉 从 与 相互 狼 立 趣 任 

互 不 相 容 事 忻 是 指 在 一 次 试验 中 不 可 能 同时 发 生 的 事件 。 者 事件 A 发 生 , 事 件 瑟 一 
定 不 会 发 生 , 那 笃 事件 和 和 事件 B 就 是 互 不 相 容 事件 ， 如 “篮球 明星 姚明 现在 在 北京 "和 
“篮球 明星 姚明 现在 在 休斯顿 "不 可 能 同时 发 生 ,那么 这 两 个 事件 就 是 豆 不 相 容 事件 . 

独立 事件 是 指 两 个 事件 发 生 的 概率 不 发 生 任 何 相互 影响 . 即 上 事件 出 现 的 概率 对 也 
事件 出 现 的 概率 不 发 生 任何 影响 ,反之 亦 然 。 例 如 ,两 个 射击 运动 员 站 在 和 不同 彼 场 的 各 
自 的 绝 仁 上 做 射击 训练 ;各 自打 中 10 环 以 上 的 概率 不 会 发 生 相 互 影响 ,就 是 相互 独立 囊 
件 。 但 如 果 是 同一 个 人 在 两 场 不 同 的 比赛 中 , 打 中 10 环 以 上 的 事件 ,就 具有 相互 关联 
性 ,这 两 个 事 忻 就 不 是 相互 独立 事件 本. 

随机 现 单 在 每 次 试验 中 的 半 果 是 随机 的 ,但 是 如 果 包 次 进行 重复 的 试验 和 观察 . 随 
机 现象 丸 会 表现 出 革 种 规律 性 或 确定 性 。 为 了 研究 随机 现象 中 的 确定 性 和 规律 性 或 随 
机 事件 发 生 的 可 能 性 ,统计 学 中 引信 慨 率 这 一 概念 。 


二 、 随 机 事件 的 概率 


(一 ) 频率 与 概率 

频率 和 概率 是 两 个 不 同 的 概念 。 频 率 是 事件 实际 发 生 的 次 数 比 率 , 概 率 则 是 事件 发 
生 的 可 能 次 数 比 率 , 前 者 是 现实 发 生 的 ,后 者 是 可 能 发 生 的 。 为 研究 某 事件 A 发 生 的 规 
律 性 ,进行 了 次 重复 试验 或 观察 ,结果 统计 出 事件 A 发 生 的 次 数 是 w, 于 是 可 以 计算 囊 


件 实际 发 生 的 次 数 比率 为 本 ,该 比率 就 叫做 事件 4 的 频率 。 


概率 只 是 事件 发 生 的 可 能 性 大小 ,并 非 实 际 观察 到 的 现实 结果 ,与 是 否 进 行 了 试验 
和 观察 也 没有 关系 。 比 如 在 某 一 班级 的 50 名 同学 中 ,男生 有 20 名 :去 生 30 名 。 如 果 采 
取 完 全 随机 抽样 的 方法 从 中 抽取 学 生 , 则 每 次 抽 到 男生 的 可 能 性 就 是 2/5, 也 就 是 抽 中 男 
生 的 概率 为 275, 这 是 一 个 确定 的 值 ,与 实际 抽取 的 铺 果 无 闫 。 统 计 学 一 般 将 上 事件 的 
概率 记 作 PC(4)， 

频率 与 概率 昌 有 本 质 不 同 ,但 也 存在 一 定 的 关联 性 。 频 率 是 一 个 波动 值 .概率 是 一 
个 确定 值 ; 频 率 的 波动 往往 是 围绕 着 概率 而 发 生 的 。 比 如 , 投 据 恰 子 游戏 中 , 棚 上 一 面 点 
数 为 1 的 概率 是 176; 如 果 投 掷 30 次 , 则 朝 上 一 面 的 点 数 为 1 的 概率 就 是 5/30, 还 是 
1/6。 但 是 ,30 次 投 据 中 , 朝 上 一 面 点 数 为 1 的 事件 实际 频数 却 不 一 定 是 5, 也 就 是 舌 率 | 
具有 随机 变化 性 ,不 一 定 是 176。 如 果 不 断 地 重新 投掷 30 次 ,得 到 的 频率 就 会 不 斯 地 变 
化 。 不 过 ,这 里 的 频率 变化 也 具有 规律 性 , 它 会 在 概率 上 下 一 个 较 小 的 范围 内 波动 。 而 
且 , 试 验 或 观察 次 数 越 多 ,频率 越 接近 于 概率 。 所 以 ,实际 研究 中 ;概率 未 知 的 情况 下 ,可 
以 利用 大 数量 的 次 观察 ,以 事件 的 频率 去 通 近 概率 ,从 而 达到 对 事件 概率 的 把 握 。 

概率 具有 以 下 三 条 基本 性 质 ， 

(1) P(tm)=1: 随 机 现象 中 所 有 可 能 结果 的 概率 之 和 等 于 1, 其 中 的 0 代表 随机 现象 。 | 


山川 器 


TE 


中 所 有 可 能 事件 之 种 。 
(2) 0 夺 PCLA) 志 1; 随 机 事件 的 概率 一 定 是 太 于 等 于 09, 小 于 等 于 1 的 ,不 可 能 为 角 ， 
条 一 事件 为 不 可 能 事件 , 则 其 发 生 的 概率 为 0; 如 一 事件 为 必然 事件 , 则 其 发 生 的 概率 


为 1 
(3 PtATB=PtAY 十 PB) 一 PLA，8); 两 个 随机 事件 之 和 {至少 有 一 个 发 生 }) 的 
慨 率 等 于 它们 各 自 慨 率 的 和 减 去 它们 之 积 ! 同 时 尝 生 }) 的 概率 ， 


由 此 可 见 ,概率 越 接近 于 0 的 事件 ,其 发 生 的 可 能 性 越 小 , 当 其 小 于 5% 时 ,统计 学 中 
- 股 将 其 定义 为 "小 概率 事件 "或 "不 大 可 能 发 生 事件 "; 概 率 越 接近 于 1 的 事件 ,其 发 生 
的 可 能 性 就 越 大 ， 


(二 ) 概率 的 加 法 和 和 法 
1. 艇 重 租 加 法 
个 互 不 相 容 事件 之 和 的 概率 等 于 它们 种 自 概率 的 和 , 即 ， 
P(A 十 A 十 二 A) 二 PCA4) 十 P(ADD 二 十 P(A4) 。( 公 趟 3 二 
这 一 加 法 定理 的 条 件 是 事件 之 间 的 * 互 不 相 容 ;也 就 是 这 一 组 不 个 随机 事件 不 可 能 
有 两 个 或 两 个 以 上 同时 发 生 。 满 足 这 个 条 件 时 ,它们 之 和 事件 的 概率 才 等 于 各 自 概 率 的 


总 简单 相 加 . 
区 【 例 3-1】 某 学 院 要 从 已 被 评 为 三 好 学 生 的 学 生 中 随机 抽取 一 名 同学 去 担任 院 学 
学 ” 生 会 主席 。 已 知 天 二 年 级 的 男生 三 好 生 右 全 部 三 好 生 的 177: 大 二 年 级 的 女生 占 全 部 三 
好 生 的 2/9。 那么 此 次 选 出 大 二 年 级 学 生 担任 院 学 生 会 主席 的 慨 率 是 多 少 呢 ? 
. 【 解 了 由 题 意 已 知 , 此 次 院 学 生 会 主席 从 三 好 生 中 选 出 ,而 全 体 三 好 生 中 ,大 二 年 级 
和 为 生 是 1/17; 大 二 年 级 女生 是 2/9。 所 以 选中 大 二 年 级 男生 的 概率 是 1/7; 选 中 大 二 年 级 
玄 生 的 概率 是 2/9。 叉 因为 此 次 内 选 出 一 人 担任 主席 ,不 可 能 同时 选 出 2 人 ,所 以 选中 男 
旬 。 生 和 选中 康生 就 基 两 个 互 不 相 容 的 事件 ， 
* 但 不 管 是 选中 大 二 男生 ,还 是 大 二 女生 ,都 为 选中 太 三 年 级 学 生 担 任 主席 ,所 以 * 选 
出 太 二 年 级 学 生 担 任 主席 "是 前 述 丙 个 事件 之 和 ,其 概率 等 于 两 个 事件 概率 相 加 , 即 
(= |=0. 365. 
但 如 内 两 个 事件 是 相互 独立 的 事件 ,就 不 能 满足 互 不 相 容 条 件 . 事 忻 之 和 的 概率 不 
能 再 以 简单 相 加 的 方式 来 计算 。 这 时 ,根据 概率 的 基本 性 质 (3) ,事件 之 和 的 概率 等 于 两 
个 独立 事件 概率 之 和 减 去 两 个 事件 之 积 的 概率 ， 
【 例 3-2】 某 党 院 要 从 已 被 评 为 三 好 生 的 学 生 中 随机 抽取 一 名 男生 和 一 各 女生 进 
太 桩 学生会 担任 掌 生 会 干部 。 已 知 大 二 年 级 的 男生 三 好 生 占 全 部 男生 中 的 三 好 生 的 
317; 大 二 年 级 的 女生 占 金 部 女生 中 的 三 好 生 的 1/3。 那 各 该 学 院 此 坎 选 出 的 校 学 生 会 十 
部 中 有 大 二 年 级 学 生 的 概率 是 多 少 呢 ? 
【 解 〗 由 题 意 知 ,该 学 院 此 次 抽取 一 务 男 生 和 一 种 友 生 进入 校 学生会 是 两 个 独立 囊 
件 , 但 不 满足 ” 互 不 相 容 "条 件 。 从 男生 中 抽 中 二 年 级 的 概率 是 37; 从 女生 中 抽 中 二 年 刘 
的 概率 是 /3," 选 出 的 两 人 中 至 少 有 一 人 是 二 年 级 " 则 为 事件 之 和 ,其 概率 为 :地 十 二 一 
Ee 


| 


下 


Rs 人。 619， 


二 
2. 租 林 有 航 匀 基 
相互 独立 的 点 个 事件 之 租 的 概率 等 于 它们 各 自 概率 的 好 积 。 即 ; 
PiA* Ayrrs li)= PA = PUA Ye P(A,) (全 束 坟 22 


在 运用 概率 的 乘法 时 ,一 定 要 注意 事件 的 " 相 下 独立 "条 件 是 否 满足 。 只 有 潢 足 相 下 
独立 性 的 一 组 随机 事件 之 积 的 概率 才 等 于 各 自 概率 的 简单 相 乘 ， 

【 例 3-3] 假如 某 一 批 体育 彩票 的 中 奖 率 为 Ti * 某 人 随机 购买 了 三 张 彩 票 ,请 问 这 
: 张 彩 票 同时 中 奖 的 概率 有 多 大 ? 有 两 张 中 奖 的 概率 有 多 大 ? 

【 解 】 由 题 意 已 知 , 每 买 一 张 体育 彩票 中 燃 都 是 一 个 独立 的 随机 事件 ,所 以 三 张 彩 


票 中 奖 是 三 个 相互 独立 的 事件 ,各 自 的 概率 均 为 57。 显然 ,三 张 彩票 同时 中 奖 是 三 个 独 


立 事 件 之 积 ,其 概率 等 于 三 个 事件 概率 的 乘积 。 即 三 张 彩票 同时 中 奖 的 概率 为 07 Xj 
ee 
WI 


有 两 张 中 奖 的 概率 如 何 计 算 呢 ? 我 们 可 以 把 三 张 彩票 中 奖 的 事件 分 别 记 作 Al A;、 
A, ,两 张 彩票 中 奖 的 事件 有 了 以 下 三 种 可 能 :BB 二 A * As ABi 二 A A * Ay.B: = 
A A Ai 显然 .Bi.B: .B, 这 三 个 事件 中 的 任 一 事件 发 生 , 就 会 出 现 " 两 张 彩票 中 
奖 ” 的 事件 ,而 且 这 三 个 事件 是 末 可 能 同时 发 生 的 ,所 以 是 三 个 互 不 相 容 的 事件 。 计 是 可 
知 ,“ 有 两 张 彩票 中 奖 " 的 概率 为 ; 
PiB)=PtB; +B+B}=PA A BA A * AtAl Ay" Ai) 
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第 二 节 ”高 散 变量 的 概率 分 布 


随机 变量 按 其 取 值 情况 可 分 成 两 类 ;一 类 是 离散 型 随机 变量 ,其 可 能 的 取 值 是 间断 
性 的 .有 时 可 能 只 有 很 有 限 的 几 个 变量 值 : 另 一 类 是 连续 型 随机 变量 ,其 可 能 的 取 值 是 连 
续 的 , 即 在 数目 上 连续 地 充 往 革 一 区 间 . 因 此 数目 是 无 限 的 。 素 节 专 门 讨论 离散 型 变量 
的 概率 分 布 。 


一 、 离 散 变量 的 分 布 列 


一 些 随机 变量 的 可 能 联 值 被 一 一 列 出 ,我 们 称 之 为 离散 变量 ;常用 分 布 列 米 描述 。 
假设 离散 变量 X 的 可 能 到 值 为 入- 苇 … 相 应 的 概率 分 别 为 Pi, Py Pw， 
则 P(X=z)= 二 PGi 一 1.2.…p 称 为 离散 型 随机 变量 X 的 概率 函数 或 概率 人 分布。 如果 
将 离散 型 随机 变量 X 的 取 值 及 相应 的 概率 列 成 表 , 就 是 一 个 概率 分 布 表 ,如 天 3 一 1 


所 未 ， 
.| 


表 3-1 离散 型 随机 变量 的 概率 分 布 表 
离 巩 型 随和 宙 变 最 XX 的 到 利 | Tr 9 5 | 


离散 型 随机 变量 各 取 值 的 概率 Pp， Pp Pp Pp . Bp 
Ruans snlaaii 
以 上 表 中 我 们 很 容易 看 出 概率 函数 具有 下 列 性 质 ， 




















下 全 二 工本 让， Sp, m=] 
离散 变 基 的 分 布 就 是 指 它 的 概率 函数 或 概率 分 布 。 例 如 , 某 学 生 在 考试 时 完全 任 铬 
测 回 答 三 道 是 非 题 , 会 产生 四 种 可 能 ,与 之 对 应 的 概率 分 布 如 表 3 -2 所 示 。 
表 3=2 完全 赁 猜测 回答 三 道 是 非 旺 时 答对 题 数 的 概率 分 布 
es 
任 猜 测 答对 的 题 数 9 | 2 9 

















各 管 对 是 数 对 应 的 概率 4 


再 出 如 ,所 一 校 假 子 ,用 X 表示 可 能 出 现 的 点 数 ,其 概率 分 布 P(X=6)= 二 (i= 
2 刘表 二 一 3 所 未 。 

















二 项 分 布 (bionimal distribution) 是 一 种 很 常见 的 离散 恋 量 的 概 豪 分 布 ,被 广泛 地 应 
用 到 心理 学 和 教育 学 的 研究 中 , 适 台 探讨 “二 项 独立 试验 "问题 ， 

所 谓 二 项 独立 试验 ,必须 满足 以 下 条 件 ， 

(1) 每 次 试验 都 只 有 两 种 可 能 的 结果 , 记 为 各 或 元， 

(2) 每 一 次 试验 都 是 在 相同 条 件 下 进行 的 ,所 以 P(A)=p, P(A)=g=1 一 p 保持 
不 变 ; 

(3) 事先 规定 了 试验 的 次 数 n; 

(4) 各 次 试验 是 相互 独立 的 , 即 各 次 试验 结果 彼此 互 不 影响 。 

在 行为 科学 研究 与 教育 测量 中 ,研究 者 常常 过 到 二 项 独立 试验 问题 ， 如 学生 在 完成 
判断 题 和 选择 题 时 ,答对 得 1 分 , 管 错 得 0 分 :在 样本 抽取 过 程 中 ,对 于 性 别 变量 来 说 ,每 
-次 抽样 ,要 么 抽 到 一 个 男性 被 试 , 要 么 抽 到 一 个 女性 被 试 ， 在 这 样 的 试验 中 ,如 果 把 事 
件 玉 记 为 1 分 ,A 就 记 为 0 分 。 于 是 进行 n 次 试验 ,就 有 十 1 种 可 能 的 夸 ( 即 0,1.2.…， 
n)* 支 的 可 能 取 值 是 事件 A 发 生 的 次 数 ,而 每 一 种 可 能 取 值 X= 的 概率 服从 于 二 项 分 布 。 

| 二 项 分 布 的 定义 是 ;在 二 项 独立 试验 中 ,每 一 次 试验 的 结果 只 有 AA 和 证 两 种 可 能 ， 


表 3-3 摆 一 枚 盘子 朝 上 一 面 的 点 数 夺 的 概 齐 分布 

流 一 
计 项 子 朝 上 一 而 的 点 数 x 1 2 3 4 5 6 

= 二 OS ge 三 EE 
号 得 点 数 对 谨 的 概率 记 也 并 亚 1 1 

P 上 A 让 国术 于 记 ， pa E 四 站 和 

号 RE 
S 

应 

二 、 二 项 分 布 

学 

(一 ) 二 项 分 布 的 定义 与 概率 


事件 A 出 现 的 概率 为 上 ,事件 下 出 现 的 概率 为 9g( 即 9 二 1 一 p), 则 事件 A 出 现 六 = 次 
(0 三 XX 二 1) 的 概率 服从 于 二 项 分 布 , 即 : 


PiX=k}=Ct pg =Op' (1— pp" (公式 3 一 3) 

公式 3-3 也 叫做 二 项 分 布 函数 ,公式 中 : 
nm! _ NN) (nn 2 mtn kt 1) ee 
i | 


利用 二 项 分 布 的 规律 ,我 们 可 以 很 容易 地 计算 二 项 试验 中 随机 事件 的 发 生 概率 。 
【 例 3-4] 10 枚 硬币 挤 1 次 或 1 村 硬币 拨 10 次 。 问 有 6 次 正面 朝 上 的 概率 是 多 
少 ? 正面 朝 上 超过 5 次 的 概率 是 儿 少 ? 


【 解 】 由 题 意 可 知 :n 二 10,p 一 q 一 序 汉 二 6， 化 入 公式 3-3 则 可 计算 5 次 朝 上 的 
概率 ， 
Pi i ] | hy 1 在 
=6)=Ch (| [| = 0. 205 


十 中 
正面 朝 上 超过 5 次 包括 四 种 情况 ;正面 朝 上 7 次 8 次 ,9 次 ,10 次。 因为 四 种 情况 的 发 
生 是 豆 不 相 容 的 ,所 以 四 种 情况 之 和 的 概率 等 于 四 种 情况 的 概率 相 加 。 即 首先 按照 上 述 同 
样 的 方法 计算 各 种 情况 的 概率 ,然后 相 加 。 于 是 可 得 正面 朝 上 超过 6 次 的 概率 卫 为 ; 
P(X>=6)=P(X=7)+ P(X=8)+ P(X=0+P(X=10) 
=Ci pop goto po Chip "og 
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正面 朝 上 为 6 次 的 概率 约 为 0.205, 正 面 朝 上 超过 6 次 的 概率 约 为 0.172。 








(二 ) 二 项 分 布 的 平均 数 与 标准 关 
根据 二 项 分 布 函 数 , 不 难 推出 , 当 p 一 4 一 元 时 ,无 论 # 取 何 值 ,二 项 分 布 都 是 旦 对 称 


休 布 的 ; 当 pp 关 9g 时 ,只 要 nn 很 大 ,而 且 满 足 m5 宇 5 和 ng 主 5, 二 项 分 布 就 会 呈现 出 接近 下 
态 和 从 布 的 趋势 ; 当 mr=co ,二 项 分 布 即 为 正 态 分 布 。 
当 二 项 分 布 接近 正 态 分 布 时 ,在 nn 次 二 项 试验 中 事件 态 出 现 次 数 的 平均 数 为 ; 


n=np (3=5) 
标准 差 为 : 
og= vnpg 【公式 汪 一 丰 ) 


如 果 把 二 项 试验 中 的 事件 A 作为 成 功 事件 , 则 上 述 公式 表示 二 项 试验 中 ,成 功 事件 
出 现 次 数 的 平均 数 /二 np, 成 功 事件 出 现 次 数 的 标准 差 oc 一 Vnp9 
[ 例 3-5】 为 了 解 学 生 最 近 的 心理 健康 状况 ,从 男生 人 数 占 志 的 班级 中 随机 抽取 30 
名 学 生 去 做 SCL - 90 量 表 。 从 理论 上 讲 ,平均 应 抽 到 几 个 男生 ? 标准 差 是 多 少 ? 
1 


【 解 了 由 题 意 可 知 :mn 一 30, 记 一 可, 代 人 上 述 公 式 得 : 


p=—np 一 30X 二 一 10 


[LLLS 


看 斗 二 机 彰 灿 地 志 兰 本 山川 剖 


bs 


夺 薪 


LL 


| 


ol. 


恒 二 np 30 让 了 A | ] 本 )=2. 38 


从 理论 上 讲 , 平 均 应 抽 到 10 有 男生 ,其 标准 差 约 为 2. 58。 


(三 ) 二 项 分 布 的 应 用 
在 心理 与 教育 研究 中 ,二 项 分 布 主要 用 来 解决 以 下 两 类 问题 ， 
1 . 术 章 成 功 下 料 出 再 者 王 过 前 上 郁 究 
【 例 3-6 从 女生 占 二 的 心理 学 王 中 随机 抽取 10 名 学 生 去 做 心理 旋转 实验 , 问 正 
好 抽 到 5 个 男生 的 概率 是 多少 ”抽取 被 试 中 不 超过 2 个 男生 的 概率 是 过 少 ? 
【 解 了 由 题 意 可 知 ,男生 比例 占 jp 一 1 一 亏 = 三 ,所 区 9 二 二 ,而 n= 10 
如 果 正 好 抽 到 了 5 和 名 男生 ,那么 &=5。 根 据 二 项 分 布 函 数 趟 ,可 得 ， 


por=5) co (#) 时) sr sy ($) (3) oa 


于 看 ,不 超过 2 个 男生 包括 三 种 情况 :第 一 种 是 没 抽 到 男生 ,第 二 种 是 抽 到 1 个 男生 ， 

第 三 种 是 抽 到 2 个 男生 , 即 X=0,X=1,X 一 2。 这 三 种 事件 是 互 不 相 容 的 ,所 以 “不 超过 酚 
P=PtA=0D+PtAS=1}+ P(N=27 

= t+Chpla" 十 Cn 让 全 


-0 ($) (8) "+cn(3) (8) +cs(#) (8) 


4 可 2 上 旺 可 i 号 
3"+10X2X3"+45X4X3 _ 07 
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2 . 饮 沈 入 育 规 通 星 质 的 向 古 

在 心理 和 教育 研究 中 ,经 常用 二 项 分 布 来 解决 含有 机 遇 性 的 问题 ,并 判断 由 猜测 所 
得 绪 果 与 直 实 铺 果 之 间 的 界限 ， 

如 某 心 理学 家 想 了 解 小 学 生 对 某 些 字 词 的 再 斌 能 力 , 于 是 他 设计 了 由 2 个 名 词组 
成 的 词 单 ， 先 让 小 学 生 识 记 , 然 后 进行 再 认 测 验 。 问 小 学 生 对 这 20 个 词 能 正确 再 认 老 
少 个 ,才能 说 明 是 真 的 有 所 记忆 而 不 是 全 靠 猜 测 得 出 的 结果 呢 ? 这 一 问题 的 解决 需要 应 
用 到 统计 推断 的 原理 和 知识 ,所 以 暂时 搁置 ,等 到 后 续 介 绍 了 有 闫 章节 的 内 容 后 再 来 
解雇 ， 


第 三 节 连续 变量 的 概率 分 布 


一 、 连 续 变量 的 概率 密度 函数 


概率 密度 函数 是 用 来 表示 连续 变量 在 革 一 区 间 的 取 值 概率 的 。 所 谓 连 续 变 量 是 指 
变量 可 能 的 取 值 充满 整个 取 值 室 间 ,任何 两 个 可 能 取 值 之 问 都 存在 无 限 才 个 可 能 的 取 


“一 生生 


值 ,无 法 全 部 列举 。 因 此 无 法 用 描述 离散 变量 的 方法 来 描述 连续 变量 的 概 挛 分 布 情况 ， 
故 引 人 概率 密度 函数 的 概念 来 描述 连续 变量 的 慨 率 分 布 。 

如 果 随 机 变量 XX 的 分 布 图 数 六 zr) 的 曲线 与 i 
X 轴 围 成 的 面积 等 于 1, 则 称 曲线 1x) 为 连续 变 。 | | 
遇 革 的 概率 密度 函数 ,简称 密度 函 数 , 而 革职 “5 
值 在 [ea, 妇 区 间 的 概率 就 是 由 [La 的 区 间 上 曲线 
Ftr) 与 工 轴 围 成 的 面积 。 如 图 3- 1 所 未 ， 
i i | ee 

需要 说 明 的 是 ,图 中 的 纵 坐 标 f(z) 不 是 代 区 
表 连 续 变量 取 值 为 + 时 的 概率 大 小 ,而 是 代表 该 随机 变量 取 值 在 点 z 处 概率 分 布 的 
密集 程度 。 事 实 上 , 对 任何 一 个 实数 < 来 说 ，P- = | 7(z)d = 0: 对 一 个 取 值 区 
间 来 说 , 讨论 概率 大 小 才 是 有 实在 意义 的 。 在 讨论 连续 随机 变量 的 概率 时 ,都 是 指 
变量 zx 处 在 一 个 确定 的 取 值 范围 内 的 概率 , 而 不 是 一 个 点 上 的 概率 ,但 ftz) 的 大 小 
能 反映 随机 变量 在 工 附 近 取 值 的 概率 大 小 , 所 以 用 窗 度 畏 数 来 描述 连续 型 随机 亚 基 
比较 直观 。 

二 、 正 态 性 概率 分 布 

在 连续 变量 的 概率 分 布 中 ,最 常见 .应 用 最 广 的 是 正 态 分 布 。 正 态 分 布 (normal dis- 
tribution}) 也 称 常 访 分 布 或 常态 分 配 ， 在 心理 学 研究 中 ,大 包 数 的 心理 现 浊 按 正 态 或 接近 
正 态 分 布 。 例 如 ,学 生 智 商 的 高 低 , 能 力 大 小 .社会 态 座 及 行为 表现 等 都 呈现 出 正 访 分 布 
的 趋势 ,其 密度 函数 曲线 表现 为 "两 头 低 , 中 间 高 ,在 右 对 称 " 的 钟 形 . 








(一 ) 正 态 分 布 曲线 及 其 基本 特征 
正 态 分 布 曲 线 的 函数 形式 可 表示 为 : 
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一 we (从 起 3 一 7) 
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"如 
其 中 ,x 为 圆周 率 3. 1415926*…: 
< 自 热 对 数 的 底 , 为 一 常数 , 约 为 2.71828; 
疡 为 正 态 分 布 的 平均 数 ; 
J 为 正 态 分 布 的 方 产 - 


正 坊 分 布 的 形态 是 由 它 的 平均 数 和 方差 决定 的 ， 
困 此 , 常 把 正 态 分 布 记 作 XY 。 正 态 分 布 函数 有 曲 
线 简称 正 态 曲线 ,如 图 3-2 所 示 。 

从 公式 3 一 7 和 正 塌 分 布 曲 线 图 ,很 容易 看 出 正 
态 分 布 及 其 曲线 有 以 下 几 个 明显 特 企 : 

(1) 正太 分 布 曲 线 位 于 工 轴 上 方 . 形 式 对 称 , 对 
ER r 称 轴 在 z= 的 位 置 上 。 
团 3-2 正 态 西 数 曲 线 (2) 正 态 分 布 中 的 平均 数 产 .中 位 数 M, 和 众 数 
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(3) 曲线 从 最 高 点 (外 三 yg) 向 左右 延伸 , 揭 点 位 于 正 负 ] 个 标准 差 处 ， 即 从 正 负 1 个 
标 淮 莽 开始. 既 向 下 又 向 外 弯 。 曲 线 两 端 向 x 轴 匹 限 靠 拢 ,但 求 远 不 与 x 轴 相 交 , 意 味 着 
该 变量 在 理论 上 任何 取 值 都 是 存在 可 能 性 的 ,其 概率 不 会 为 0。 

(4) 正 态 曲线 下 的 面积 为 1, 由 于 曲线 在 六 = 处 左右 对 称 , 所 以 经 过 X 一 产 处 的 重 
线 将 曲线 下 的 面积 平分 成 两 份 , 各 为 0.5。 

(5) 正 态 分 布 是 由 随机 变量 的 平均 数 ju 和 标准 差 o 唯一 决定 的 和 分布。 如 果 平 均 数 r 
和 标准 差 = 不 同 , 正 态 曲线 明 现 的 位 置 和 形态 也 不 同 。 正 态 分 布 曲 线 的 位 置 由 平均 数 1 
的 到 小 决定 ,如 图 3 一 3 所 示 ; 分 布 曲 线形 访 则 是 由 标 淮 差 sg 的 夫 小 决定 的 ,s 越 到 ,曲线 
越 低 . 越 宽 阁 ,ac 越 小 ,曲线 越 高 . 越 狭 窗 , 如 图 3-4 所 示 ， 
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法 AIITUTS 4 re 
2 图 3-3 平均 数 乎 等 -标准 苦 相 等 的 正 意 盆 布 图 3=-4 平均 数 相 等 ,标准 状 不 等 的 正 访 萤 布 
和 
(二 ) 标准 正 态 分 布 
应 通常 我 们 所 使 用 的 正春 分 布 是 指正 态 分 布 的 标准 形式 , 称 为 标准 正 态 分 布 (standard 
normal distribhutiony。 标 谁 正 坊 ee 标准 差 os 二 1 的 随机 变量 的 概率 分 
9 布 。 记 作 Ni0,1), 其 密度 函数 如 公式 3-8 所 示 , 标 准 正 态 分 布 曲 线 如 图 3-5 所 示 。 
本 
] = 
王 一 一 一 一 一“ | (ao Ton) 【多 起 呈 一 号 ) 
国 VY A 下 


对 比 公式 3 - 7 和 公式 3 一 8, 再 联系 到 上 

- 章 中 的 标准 分 计算 公式 ,可 以 很 容易 地 发 
现 , 如 果 将 正 态 分 布 函 数 中 的 二 换 成 标准 分 
2 的 时 候 , 所 有 的 正 态 分 布 函数 均 可 以 表示 成 
公式 3-8 所 未 的 标准 正 态 分 布 函数 形式 ,只 是 
| 要 将 工 换 成 Z, 如 公式 3-9 所 示 。 可 见 ,所 有 
四 分 布 都 可 以 通过 Z 分 数 转化 为 标准 正 
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] Z 分 数 的 概念 ,性 质 和 线性 转换 已 在 上 一 章 有 详细 地 介绍 ,此 处 不 再 重复 。 由 于 Z 
分 数 单 位 相同 ,具有 等 距 性 .所 以 来 自 不 同 数据 样本 的 分 数 均 可 在 转换 成 Z 分 数 之 后 进 


行 比较 - 
三 、 正 态 分 布 表 及 其 应 用 


(一 ) 正 态 分布 开 

正 态 分 布 表 就 是 依据 标准 正 态 分 布 的 有 关 概 率 编 制 而 成 的 。 该 表 ( 和 参见 附 表 2) 包 括 
三 栏 ;第 一 栏 为 标 淮 分 数 Z 值 ,表示 分 布 底线 即 
可 轴 上 的 位 置 ;第 二 栏 为 Y 值 ,表示 与 某 一 分 
数 对 应 的 曲线 上 的 点 的 级 坐标 或 高 度 :第 三 栏 为 
概率 卫 值 ,表示 在 曲线 下 Z 值 在 0 与 某 一 值 的 
区 间 内 的 面积 (好 Z 值 处 在 此 区 间 内 的 概率 )， 
因此 这 一 转换 表 也 叫做 PZY 转换 表 ( 有 的 教材 
用 口 代 埋 下 .所 以 也 把 这 个 表 叫 做 PZOD 转换 0 区 
表 ),P.Z.Y 三 者 的 关系 可 以 直观 地 表示 成 图 图 -6 标准 正 态 天 布 中 PP.Z.Y 的 美 系 
3-6 的 形式 。 
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(二 ) 正 态 分 布 表 的 应 用 

使 用 正 访 分 布 表 时 ,要 注意 两 点 :首先 ,由 于 正 态 曲线 在 2 =0 处 左右 对 称 , 所 以 表 
中 仅 列 出 了 莹 =0 右 侧 的 Z.Y.P 值 。 如 果 Z 一 0, 在 正 态 分 布 表 中 查 - 了 所 对 应 的 立 和 和 
值 即 可 。 其 次 ,对 于 服从 正 态 分 布 的 变 基 .六 , 先 通过 2 转化 为 Z 值 后 ,才能 
查 表 。 

利用 正 态 分 布 的 PZY 转换 表 , 可 以 进行 如 下 的 计算 : 

1 . 已 塌 二 草民 握 蓝 

分 三 种 情况 : 

第 一 ,计算 Z=0 至 某 一 Z 值 之 间 的 概率 (面积 )y。 可 以 直接 查 PZY 表 , 找 出 与 该 Z 
值 对 应 的 PP 值 即 可 。 如 2Z=0 至 2Z==1 之 间 的 面积 为 0. 34134;Z=0 至 2 三 2 之 间 的 面积 
rd 

第 二 ,计算 两 个 ZZ 值 所 界定 的 区 间 内 的 概率 {面积 ;7。 若 两 个 Z 值 符号 相同 , 即 同 为 
正 值 或 同 为 角 值 ,它们 之 间 的 面积 等 于 两 个 Z 代 至 Z==0 之 间 的 面积 之 差 ; 若 两 个 Z 值 符 
号 相反 ;它们 之 间 的 面积 等 于 两 个 Z 值 至 Z==0 之 间 的 面积 之 和 。 如 :计算 Z 二 1 至 Z 二 2 
之 间 的 面积 ,首先 要 查 出 Z=1 和 2 二 2 时 的 已 值 , 因 为 二 者 同 为 正 值 ,所 以 可 以 用 较 大 
的 P 值 碱 去 较 小 的 PP 值 就 可 以 得 到 2 值 在 [1,2] 区 间 内 面积 , 即 Pr 二 0. 47725 一 
0. 34134= 二 0.13591。 计 算 Z=1 至 2Z= 一 一 2 之 间 的 面积 , 则 因为 两 个 Z 值 符号 相反 , 需 将 
两 个 了 值 相 加 得 到 Pi; 二 0.47725 十 0. 34134 二 0. 81859， 

第 三 ,计算 某 一 工 值 以 上 或 以 下 的 面积 。 首 先 查 表 香 到 与 此 < 值 相 应 的 面积 。 如 果 
2 二 0, 则 Z 值 以 上 的 面积 等 于 0.5 减 去 查 表 得 到 的 面积 ,2Z 值 以 下 的 面积 等 于 0.5 加 上 
查 表 所 得 到 的 面积 ;如 果 Z< 二 0, 则 Z 值 以 上 的 面积 等 于 0.5 加 上 查 表 得 到 的 面积 ,Zz 值 以 
下 的 面积 等 于 0.5 减 去 查 表 所 得 到 的 面积 。 比 如 计算 Z=2 以 上 的 面积 ,首先 查 出 与 Z 
二 2 相对 应 的 面积 0. 47725, 所 以 Z=2 以 上 的 面积 为 9.5 一 0. 47725 二 0,02275; 计 算 Z= 
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2 以 下 的 面积 , 则 为 0.5 十 0 47725 一 0.97725 。 

2. 已 利己 天 二 草 

在 查 表 前 .要 先 根据 问题 本 里 的 表述 找到 卫 在 正 态 分 布 中 的 对 应 位 置 ,然后 区 分 不 
同情 闹 查 表 得 到 对 应 的 ZZ 值 ,也 分 三 种 不 同 的 情 疯 ; 

第 一 .已 知 的 P 值 是 从 Z=0 处 向 右边 计算 的 , 可 以 直接 在 正春 分 布 表 中 查 到 与 该 
P 忆 值 对 应 的 Z 值 ; 已 知 的 卫 值 是 从 Z=0 处 癌 堪 边 计算 的 . 可 以 直接 在 正 访 分 布 表 中 查 
到 与 该 PP ee Z 值 并 加 上 商号 .如 已 知 从 =0 处 向 右 计 算 的 面积 为 0.34134. 则 
直接 查 表 得 到 ZZ 二 1; 如 已 知 从 Z=0 向 左边 计算 的 面积 为 0.47725, 则 查 表 得 到 与 P= 
0. 47725 ep 2 后 ,加 上 负 号 得 到 Zz 二 一 2， 

第 二 ,已 知 的 值 是 从 正 态 分 布 曲 线 的 尾 端 计算 的 ,就 需要 对 该 面积 做 转换 后 查 表 。 
如 果 已 知 面 积 是 从 左 尾 端 开始 计算 的 ,可 用 一 0.5 所 得 结果 的 绝对 值 作为 面积 去 查 正 
访 表 ,得 到 2 值 。 当 PP 一 0.5 二 0 时 ZZ 为 正 值 :P 一 0.5 二 0 时 2 为 负 值 。 如 果 已 知 面积 是 
从 右 尾 端 开 既 计算 的 ,可 用 0.5 一 P So 为 面积 去 查 正 态 表 ; 得 到 2Z 值 。 


当 0,5 一 了 让 0 时 ZZ 为 正 值 :0.5 一 P 过 0 时 Z 为 负 值 ， 
ee te on: 0,. 15 ,计算 其 对 应 的 莹 值 ， 首先 ,计算 
0,15 一 0, 5 三 一 0., 35 二 ,然后 用 0. 35 作为 面积 查 表 得 到 的 对 应 ZZ 分数 约 为 1.035。 因 为 


这 里 的 PP 一 0.5 二 0 所 以 所 得 结果 应 记 为 负 值 ， 于 基 得 到 从 正 态 分 布 左 边 尾 端 计算 面积 
为 D015 所 对 应 的 慰 淮 分数 为 一 1. 035。 . 

第 三 ,已 知 正 态 曲线 居中 部 分 的 面积 局, 计算 对 庶 的 三 值 。 首先 ,用 居中 部 分 的 面积 
P 除 以 2, 得 P/2, 然 后 , 找 与 Pj/2 相对 应 的 Z 值 。 左 侧 Pi2 面积 对 应 的 也 值 为 负 ; 右 全 
Pi2 面积 对 应 的 世人 值 为 正 。 倒 如 ,已 知 居 中 部 分 的 面积 了 二 0.68268, 求 其 对 应 的 左 布 侧 
的 Z 值 。 首先 0. 68628/2 二 0. 341343 然 后 查 正 态 表 得 到 与 0. 34134 对 应 的 工 值 为 1, 所 
以 对 应 的 堪布 两 侧 的 也 值 分 别 为 一 1 和 1， 

3. 已 和 归 忆 或 二 时间 上 卫 

第 一 .已 知 P 值 计算 Y。 先 根据 已 知 P 的 计算 起 点 ,转换 出 从 ZZ=0 和 开始 计算 的 面积 
值 ,再 根据 这 一 面积 查 正 态 玫 得 到 相应 的 了 值 。 例如 .已 和 基 从 正 意 分 布 曲线 的 左边 尾 端 
计算 的 面积 是 0.65, 则 很 容易 地 找到 对 应 于 从 工 = 昌 处 开始 的 计算 的 面积 为 避 6 一 和. 50 
一 0.15, 以 面积 15 查 正 态 表 得 到 的 Y==0. 3704。 

第 二 ,已 知 Z 值 计算 Y, 不 管 已 知 的 芋 值 是 正 还 是 人 负 , 痢 直接 用 的 交 对 值 去 查 
正 态 表 , 即 可 得 到 与 该 芝 值 对 应 的 Y 值 。 例如 ,ZZ 一 0.60;, 查 表 得 到 Y=0.33322;Z= 
一 1., 50, 杏 正 坊 表 得 到 Y=0. 12952， 


、 正 态 分 布 在 实践 中 的 应 用 


前 一 重 蕊 经 从 绍 过 将 原始 分 数 转 换 成 标准 芬 , 以 便 对 各 个 分 数 在 熬 据 总 体 或 数据 样 
本 中 的 相对 排 位 进行 评估 ,对 来 自 不 同 测 量 标 统 的 ,有 具有 不 同 质 的 数据 进行 比较 。 在 对 
样本 或 总 体 进行 多 项 测评 时 ,为 了 计算 名 项 测评 结果 的 总 平均 分 .也 需要 将 各 项 测评 分 
数 转换 成 标准 分 ,然后 计算 标准 分 的 平均 或 加 权 平 均 。 对 于 标准 分 的 这 两 方面 的 应 用 ， 
此 处 不 再 蓝 述 .下面 介 绍 另 外 几 个 方面 的 实际 应 用 。 


{ 一 ) 估算 一 定 分 数 区 问 的 人 数 

如 果 某 种 测验 分 数 的 总 体 是 正 访 分 布 的 ,那么 可 将 分 数 转换 为 标准 Z 分 数 , 根 据 正 
访 分 布 表 导 算 各 种 不 同 的 分 数 区 间 对 应 的 面积 ,而 这 一 面积 正 是 出 现在 相应 分 数 区 间 内 
的 个 案 比 率 。 

【 例 3-7】 某 高 二 年 级 学 生 小 杨 , 在 参加 全 市 中 学 生 数学 竟 赛 中 取得 了 76 分 ,已 知 
所 有 参加 竞赛 的 学 生 的 平均 分 为 52 分 ,标准 盖 为 15 分 。 此 次 计划 按照 分 数 高 低 评 选 出 
-二 ,三 等 蜂 的 获奖 人 数 占 10%。 请 问 ,小 杨 在 此 次 竞赛 中 能 获得 奖励 吗 ? 

【 解 〗 这 一 问题 ,实际 上 是 要 估算 出 参加 竟 赛 的 学 生 中 超过 小 声 分 数 的 人 所 占 的 百 
分 数 。 为 此 , 先 要 将 小 杨 的 分 数 转 换 为 标准 分 ， 因 为 参加 竞赛 全 体 同 学 的 成 绩 平 均 数 和 
标准 差分 别 为 :jp 一 52,a 一 15。 根 据 标 准 分 的 定 多 得到; 

2— 1.6 

查 附 表 2“ 正 访 分 布 的 PZY 转换 表 " 可 得 :P= 二 0.4452。 国 六 2 二 1.6 守 0, 所 忆 在 接 世 
值 之 上 的 面积 为 P'=0. 50 一 0. 4452 一 0.0548。 可 见 , 超 过 小 杨 分 数 的 人 只 占 5.48 昕 ,也 
就 是 说 ,小 杨 的 分 数 进入 到 了 前 10 纪 的 范围 ,可 以 获奖 。 


(二 ) 估算 录取 分 数 线 

在 选拔 性 的 考试 或 竞赛 中 ,如 果 考 试 成 绩 服 从 正 态 分 布 , 那 么 ,我 们 就 可 以 利用 正音 
曲线 下 的 面积 已 ,根据 录取 的 比例 估计 录取 分 数 线 ， 

【 例 3-8] 某 次 公务 员 考 试 参加 人 数 是 600, 成 绩 服 从 正 态 分 布 ,平均 成 绩 是 65 分 ， 
标准 若是 15 分 。 如 果 计 划 选 取 120 人 进入 复试 ,那么 进入 复试 的 分 数 线 应 基地 少 ? 


【 解 】 600 人 参加 考试 ,120 人 进入 复试 ,所 以 进 和 复试 的 比例 P 一 0 一 0. 20. 因 为 进 


人 复试 的 应 是 高 分 者 ,所 以 这 里 的 王 值 应 是 从 正 态 分 布 的 右边 尾部 开始 计算 的 面积 ,于 是 
可 知 划 线 位 置 到 Z=0 之 间 的 面积 是 P==0. 50 一 0, 20 二 0, 30。 以 0. 30 查 附 表 2 的 正 态 分 布 
表 , 可 以 得 到 2Z==0, 84, 即 分 数 线 应 在 高 于 平均 分 0, 84 个 标准 差 的 位 置 , 于 是 得 到 的 分 数 线 ， 
X=p+Z"o=65+0. BX15=77.6 
此 次 公务 员 选 披 考试 中 ,进入 复试 的 分 数 线 为 ?7.6 分 。 
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(三 ) 确定 等 级 评定 的 人 数 

在 心理 学 研究 中 ,智商 一 般 被 认为 是 正 态 分 布 的 。 如 果 按 智商 分 数 分 组 ,每 组 或 每 
个 等 级 应 该 有 雪上 少 人 昵 ? 此 类 问题 也 可 依据 正 态 分 布 理论 来 解决 . 方法 是 :用 5 个 标准 
差 的 宽度 (从 Z= 一 3 到 2Z= 十 3 覆盖 了 正 态 曲线 下 面积 的 的 ,73 站 ,接近 于 全 部 覆盖 ) 除 
以 拟 划 分 的 组 数 或 等 级 数 , 计 算得 到 每 一 组 或 每 一 等 级 所 占 的 宽度 ,就 可 以 得 到 各 个 等 
级 之 间 的 划 芬 钱 。 这 些 分 界线 以 ZZ 分 数 表示 时 ,就 可 以 查 正 访 分 布 表 ,得 到 各 组 或 各 等 
级 在 等 中 情况 下 的 人 数 比 率 ,进而 计算 出 种 个 等 级 的 人 数 ， 

【 例 3-9 要 根据 智商 把 200 人 划分 为 5 个 等 级 ,各 等 级 应 有 多少 人 人? 


【 解 】 按 6 个 标准 差 的 宽度 平均 划分 为 5 个 等 级 ,每 个 等 级 的 宽度 为 :之 =1.25 
则 各 等 级 的 区 间 与 人 数 比 率 . 人 数 如 表 3 -4 所 未 ， 


和 
于 | 


表 3-4 智商 分 为 五 等 级 时 各 组 人 数 分 布 [N=200) 





等 组 各 等 级 区 加 比率 计算 比率 (31) 应 占 太 数 
优秀 1.85 以 上 D5— 0,. 6407 | EE 
路 二 0 Ba— 1 Bo 站 #647 0 22575 23. 832 48 
中 : 雷 一 蛋 首 5 一 站 全 LO, 2575 45; 15 9 
中 下 —1, Br—0, a 相合 4 人 一 心 。 33575 23. 832 4 
:ee -3q—— 1: Be 09, 5—0, 46407 3. B93 7 





第 四 节 ”频数 分 布 分 析 的 SPSS 过 程 


某 一 随机 事 忻 在 sn 次 试验 中 出 现 的 次 数 称 为 这 个 随机 事件 的 频数 (frequeney)。 各 
种 随机 事件 在 w 次 试验 中 出 现 的 次 数 分 布 称 为 频数 分 布 ,将 其 用 表格 的 形式 表示 出 来 称 
为 频数 分 布 表 。 频数 分 布 表 的 制作 及 相应 频数 分 析 的 SPSS 过 程 主要 包括 以 下 步 又 : 

步 又 1; 选择 Analyze 药 单 中 的 “Desceriptive Statistics"; 然 后 单 击 “ Freguencies" 合 仿 
打开 频数 分 析 对 话 框 ,如 图 3-7 所 示 , 该 对 话 框 的 主要 功能 是 用 来 定义 频数 分 析 ， 


LL 


i 





图 3-7 所 孙 的 主 对 话 框 上 ,有 两 个 变量 列表 框 , 其 中 左边 的 变量 框 会 络 出 数据 文件 
中 所 有 的 多 部 变量 列表 ,用 户 可 以 从 中 选择 拟 进 行 频数 分 布 分 析 的 变量 ,将 这 些 变 量 选 
中 后 点 击 " 国 "使 其 进入 到 "Variables" 列 表 框 。 如 果 同 时 选择 凶 个 变量 ,SPSS 就 将 分 别 
产生 各 个 变量 的 频数 分 布 表 ， 

当 过 要 输出 频数 分 布 表 时 ,就 在 对 话 框 上 “Display frequency tables" 前 的 小 方 框 中 
单 击 一 下 ,小 方 框 中 会 出 现 “、/ "标记 ,表示 已 选择 此 功能 ,系统 将 输出 要 分 析 的 变量 的 频 





图 33= 了 频数 分析 的 主 对 话 框 


数 分 布 表 。 如 果 要 取消 频数 分 布 表 的 输出 设 先 ,可 再 单 击 该 小 方 框 “Wy "标记 消失 ;系统 


就 不 会 输出 频数 分 布 表 。 
步骤 2: 单 击 对 话 框 上 的 “Statistics…" 按 钮 ,打开 如 图 3-8 所 示 的 对 语 框 , 该 对 话 框 
元 


主权 由 4 个 选项 区 组 成 ,下 面 就 其 中 主要 的 项 目 分 别 作 简单 说 明 


LL 





国 卫 = 让 炳 数 分 市 分 析 的 特征 量 选 项 对 话 杠 


百 和 分 位 输出 设置 区 (Pereentile Values)。 作 以 下 选择 可 分 别 输出 不 同 的 百 分 位 数 : 

(1) 四 分 位 数 (Quartiles) ,输出 第 一 ,第 二 ,第 三 个 四 分 位 数 , 也 叫 敌 25 吕 位 数 ,50 闹 
位 数 和 ?75 昨 位 数 。 

(2 输出 一 系列 的 百 分 位 数 , 以 便 将 数据 样本 按照 个 案 数 平均 划分 成 者 干 相 等 的 组 
从 (Cut point for equal group), 并 显示 出 这 些 百 分 位 数 ， 如 在 Cut point for equal 
gtroub” 输 人 5, 则 系统 就 会 输出 30 40 60 了 .B80 四 个 百 分 位 值 。 

(3) 用 户 自 定义 需要 输出 的 百 分 位 数 (Percentiles}。 用 户 在 色 选 了 “Percentiles” 功 
能 后 ,可 在 其 后 的 方 框 中 输入 0 一 100 之 间 的 尾 一 个 整数 , 单 击 Add 按钮 添加 到 下 面 的 方 
框 内 ,此 操作 可 以 根据 需要 重复 多 次 进行 。 单 击 “Change" 和 "Remove "按钮 ,可 以 修改 或 
删除 框 内 的 数值 。 

华中 量 数 .变异 量 数 输出 设置 区 (Central Tendency、Dispersion)。 此 区 域 与 前 一 侍 
介绍 的 “Descriptive" 过 程 打 开 的 对 话 框 功能 相似 。 用 户 根据 需要 ,也 可 以 利用 这 两 个 设 
置 区 获得 变量 的 平均 数 , 总 和 , 标准 差 . 方差 ,全 距 、 最 大 值 和 最 小 值 等 的 计算 结果 , 同 
时 还 可 以 获得 众 整 (Mode) 和 中 位 数 (Median) 的 计算 结 洒 。 

用 户 在 相应 设置 区 作出 需要 的 选择 和 设置 后 单 击 "Continue 返回 上 一 层次 的 对 话 
框 ,再 单 击 *OK" 即 可 得 到 所 需要 的 频数 分 布 表 ,描述 性 特征 基 和 要 求 其 计算 的 百 分 位 数 ， 


二 、 频 数 分 布 图 的 制作 


单 击 图 3-7 所 示 对 话 框 上 的 "Charts” 按 钮 打开 如 图 3-9ta) tb)、te) 等 所 示 的 对 语 
框 ,利用 这 些 对 话 框 可 以 对 频数 分 布 图 的 类 型 和 变量 性 质 进 行 设 置 。 

图 形 类 型 Chart type) 各 选项 : 

(1) None: 不 显示 图 形 , 它 是 系统 默认 选项 。 

(2) Bar charts; 条 形 图 ,适用 于 离散 型 随机 变量 。 当 选择 "Bar charts” 或 “Pie 
charts” 时 ,“Chart Values" 栏 才 被 激活 。 如 果 选 择 "Bar charts” ,在 "chart values" 栏 里 选 
择 *Frequencies”, 图 的 纵 坐 标 代 表 频 数 ; 选 择 “Percentages”, 纵 坐标 将 代表 频率 , 即 百 分 
数 , 如 图 3-9a 所 示 。 
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图 3=9 粮 球 他 布 图 制作 设置 对 话 杠 


(3) Histograms: 直方 图 ,适用 于 连续 型 随机 变量 。 选 择 此 项 时 还 可 以 确定 是 否 选 
择 "With normal curve”, 如 果 选 择 ， 则 在 显示 的 直方 图 中 附带 正 态 曲 线 ， 有 助 于 判断 数据 
旺 香 呈正 态 分 布 ,如 图 3-9b 所 示 。 

(4) Pie charts; 饼 图 。 当 选择 ”Pie charts" 时 ,在 "Chart Values 一 栏 选择 *Freguen- 
cies" ,图 的 乌 撒 分 制 片 表示 频数 ;选择 "Percentages”, 剧 形 分 割 片 将 代表 频率 , 即 百分数 ， 
加 图 3 -9c 所 未。 

各 选项 确定 后 , 单 击 "Continue" 接 钮 返回 主 对 话 框 , 单 击 "“OK”, 生 成 的 频数 分 布 图 就 
会 在 输出 窗口 中 显示 出 来 。 

【 例 3-10] 利用 SPSS 系统 制作 频数 分 布 表 和 频数 分 布 图 。 表 3-5 所 示 是 某 初中 
二 年 级 1 班 在 2007 一 2008 年 度 第 一 学 期 部 分 课程 期 末 考 试 成 绩 , 试 针 对 这 些 数 据 制 作 
季 生 在 3 门 课 程 上 的 频数 分 布 表 和 频数 分 布 图 ， 

囊 3-5 某 初中 二 年 级 1 班 学 生 2007 一 2008 学 年 第 一 学 期 部 分 课程 考试 成 缚 
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【 解 ] 主要 的 操作 步骤 如 下 ，; 
步骤 1; 建立 数据 文件 
局 动 SPSS 系统 ,进入 上 默认 的 启动 界面 一 一 数据 编辑 器 。 按 照 第 二 章 所 介绍 的 方法 


建立 SPSS 数据 文件 。 如 果 答 将 表 3-5 中 的 信息 全 部 记录 在 该 数据 文件 中 , 则 需要 定义 
五 个 蛮 量 , 即 ;: 学 号 fid ,性别 (Cgender), 语 站 tehinese) ,数学 cmath) 和 和 草 语 cenglish)。 其 
中 性 别 变量 的 变量 值 类 型 可 以 设置 成 字符 型 (string) ,以 便 直接 输入 学 生性 别 的 " 男 " 或 
“ 女 ", 也 可 以 是 数字 型 (numeric) ,可 分 别 用 1 和 2 代表 不 同 的 性 别 。 其 他 变量 值 类 型 均 
由 系统 默认 为 数字 型 。 变 量 定义 好 之 后 ， 可 由 合用 站 档 的 复制 Ceopy} 和 和 精 巾 tpaste} 功 能 
直接 将 表 3-5 中 的 数据 输 人 到 SPSS 数据 编辑 窗 中 。 一 个 变量 占 一 到 .一 个 学 生 占 一 
行 , 所 以 该 数据 文件 的 数据 区 由 30 行 5 列 组 成 。 

步骤 2: 对 话 框 操作 

(1) 选择 "Analyze” 下 的 "Descriptive Statisties" 荣 单 . 单 击 "Frequencies" 命 令 ; 弹 出 
“Frequencies”" 对 请 框 。 在 对 话 框 杰出 的 变量 列表 中 选择 "chinese” math” ”English” 本 
晤 , 单 击 添加 按 和 所 " 国 轩 "将 这 三 个 变量 名 漆 加 到 "Variable" 框 中 . 

(2) 选中 对 话 框 左下 角 的 “Display fredueney table* 复 选 框 ,以 便 标 统 输出 三 门 课程 
成 绩 的 频数 分 布 表 。 

《3) 如 果 想 同时 获取 三 门 课程 成 绩 的 平 掏 数 , 标 淮 差 ,最 小 值 , 最 大 值 、 中 位 数 等 统 
计量 ,可 单 击 对 话 框 上 的 "Statisties" 接 钮 ,选中 相应 的 项 目 后 点 击 "continue" 返 回 主 对 话 框 ， 

(4) 单 击 对 话 框 上 的 “Charts" 技 钮 ,打开 频数 分 布 图 制作 对 话 框 。 因 为 三 门 课程 考 
试 成 缚 均 为 连 总 变量 ,所 以 选择 输出 直方 图 ”Histograms" ;并 选择 "With mormal eurve” 
以 便 在 直方 图 上 附带 正 态 曲线 。 单 击 “Continue 返回 主 对 话 杠 ， 

(5) 单 击 “O 〇 OK" 按钮 .完成 对 话 框 操作 。 系 统 就 会 输出 所 需要 的 上 述 结果 。 

步骤 3: 结 果 读 取 .选择 与 编辑 

根据 题目 要 求 和 上 述 对 话 框 操作 ,输出 铺 果 主要 包括 三 个 部 分 :频数 分 布 表 .数据 样 
本 的 主要 统计 量 和 频数 分 布 直方 图 。 因为 针对 三 门 课程 成 绩 的 统计 分 析 输 出 结果 的 内 
容 和 结构 一 样 , 所 以 这 里 只 选择 "语文 "数据 分 析 晴 果 为 例 来 说 明之 。 

(1) 描述 性 统计 基 , 为 便于 将 来 能 够 正确 读 取 输出 结果 ,在 不 对 输出 结果 作 任 何 更 
改 的 情况 下 ,直接 将 其 粘贴 在 这 里 ,如 表 3-6 所 未 。 

表 3-6 语 交 成 绩 统 计 分 析 得 到 的 描述 性 统计 量 (Statistics;CHINESE)} 













Valid | 30 

3 Nlisaing 有 
Nean 县 全 100n 
edian | Bl. A000 

Niede ?75. 00 
Std, Deviation 9. 38947 

Varianece : Ba, 16207 
Range 40, Dn 
Minimurm 9, O90 
MaxirmLum 了 站 让. go 

SUT 2403, D0 
Percentiles 器 避 0D 
B81. O000 


盖 煌 大 灿 涯 国 后 川 区 


5 B87 0000 
a Multiple modes exiat. The smallest value is ahown 
LL 了 6 


由 表 3-6 可 以 读 取 的 主要 结果 如 ， 


参加 考试 的 学 生 人 数 :N 一 30 语 立 成 绩 的 平均 分 :Mean 二 80, 10 
中 位 数 ;Median= 二 81.00 从 数 ,Mode 二 75, 00 

标准 差 ;Sta. Deviation 二 9. 39 方 着: Variance 二 88. 16 

全 有 虹 ;Range 二 40. 00 总 和 和 :Sum 二 2403 


四 筋 信 数 ;25 饭 位 数 = 二 74, 50 50 色 位 数 =81.00 75 儿 位 数 =87. 00 
(2) 频数 分 布 表 ,将 SPSS 系统 输出 的 频数 分 布 表 粘贴 于 此 ,如 甫 3-7 所 示 。 
素 3-7 语文 成 绩 频 数 分 布 囊 {CHINESE) 


Frequency Percent Valid Percernt Cumulative Percent 

Walid Bo, On 1 | 9. 对 二 -部 
B55, ON 吕 人 了 日 .了 10,0 
867,00 | 3.3 3.3 13. 3 
FO,. OO 加 让。 了 Bi 2 ,0 
73, 00 1 条 六 .3 23.3 
5,. 00 | 10.0 10. 0 33 
?7 D0 1 3 守 。 怠 6.7 
ms 了 8。 OO 时 站 ,了 让 .了 3. 
B80. DA 些 上 了 B.7 50. 0 
B82 00 | 地; 习 Ne Pr ee] 
83. 00 1 下 3 3.3 56.7 
P 8 OO 2 站 了 6.7 站 3: 过 
85. 00 2 6.7 6.7 70.0 
=: 86. 00 1 3.3 3 73.3 
三 B87. OO 总 下 6 ? 蝇 必 。 自 
H B9. V0 3 10. 业 D0. 00. 0 
oD. 00 1 总 。 填 相对 93.3 
95. 00 | 号 : 和 号 9 
100, 090 | 二 : 名 号 . 训 100.0 

Total 3 100, 0 10n,.0 


由 表 3-7 了 可 知 : 语 立 考 试 中 出 现 的 所 有 分 数 ( 表 中 控 从 小 到 去 排列 ) ,每 一 个 分 数 出 
现 的 人 次 LFrequency) 及 其 占 总 人 数 的 比率 iPercent) ,由 小 到 太 累 加 的 百分数 (Cumula- 
tive percent} , 
(3) 频数 分 布 图 ,将 SPSS 系统 输出 的 频数 分 布 直方 图 直接 粘贴 于 此 ,如 图 3-10 
所 示 。 
该 图 是 以 分 数 区 间 来 登记 频数 的 ,而 每 一 区 间 的 宽度 5 分 , 槛 坐标 上 标 出 的 坐标 值 
是 每 一 区 则 的 组 中 值 , 纵 举 标的 高 度 代 表 估 次数, 而 图 中 的 曲线 是 附带 的 正 访 分 布 曲线 ， 
| ”是 作为 参考 使 用 的 。 从 图 中 可 以 看 出 ,57, 5 一 62.5 区 间 有 1 人 次 ;62, 5 一 67, 5 区 间 有 3 
| 人 次 ;频数 审 度 最 大 的 是 82. 5 一 87.5 区 间 , 共 有 8 人次。 此 外 ;还 可 以 看 出 ,数据 分 布 形 


态 未 能 很 好 地 与 正 态 分 布 哮 从， 
元 | 





ei Ta 2 | 
600 650 700 750 R00 0 M0 95.0 1000 
CHINESE 


团 3-10 语文 威 绩 的 频数 分 布 直方 图 
数学 和 和 葛 语 的 频数 分 析 结 果 的 结 枸 与 解释 方法 与 上 述 语 文成 绩 频 数 分 析 相 同 ， 


叫 # 一 二 二 惫 习 思 吉 与 练习 是 二 一 一 好 


1. 解 词 

随机 现象 ,随机 事件 .基本 事件 ,复合 事件 ,事件 之 和 ,事件 之 积 、 互 不 相 容 事件 ,相互 
独立 事件 .概率 .频率 . 正 态 分 布 . 标 准 正 态 分 布 . 标 准 Zz 分 数 

2. 下 列 现象 中 ,哪些 是 随机 现象 ? 

(1) 太 选 已 进入 计 票 阶段 ,新 一 届 总 统 将 从 三 位 收 选 人 中 产生 。 

(2) 随意 向 上 抽出 一 个 山子 ,其 落 在 香 面 时 朝 上 一 面 的 点 数 可 能 有 六 种 结果 。 

(3) 从 班级 中 随意 选 出 5 人 组 成 班 委 ; 下 一 次 考试 分 数 最 高 的 人 将 当选 党 习 部 长 。 

(43 和 班主任 老 师 蕉 备 让 他 认为 能 力 最 强 的 3 位 同学 分 别 担任 班长 ,党 支部 书记 、, 团 
支部 书记 。 

3. 下 列 哪些 是 随机 事件 ? 在 这 些 随机 事件 中 上 娜 些 是 基本 事件 ,哪些 是 复合 事件 ? 

(1) 预赛 中 ,中 国 3 名 运动 员 中 可 能 会 “有 人 进入 决赛 ", 甚 至 "都 有 可 能 进入 决赛 ”。 

(2) 革 客 户 在 轨 行 存 人 了 2 万 元 现金 , 存 期 2 年 ;到 期 时 其 应 得 利息 可 能 达到 的 
数额 。 

(3) 20 名 同学 参加 英语 考试 ,及 格 超 过 半数 ,全 部 及 格 或 全 部 得 满分 的 可 能 结果 ， 

ty) 村 同学 仅 任 猜测 完成 5 道 四 选 一 的 选择 题 ,全 做 对 的 可 能 结果 ,做 对 3 是 的 可 
能 结果 。 

4. 下 列 哪 种 事件 是 属于 事件 之 和 , 哪 种 事件 是 属于 事件 之 积 ? 

(1) 仅 任 猪 测 完成 4 道 四 选 一 的 选择 题 ,全 做 对 ,做 对 1 题 或 做 对 2 题 的 可 能 结果 ， 

C2) 从 0 一 9 的 10 个 数码 中 随意 捡 出 一 个 ,其 结果 为 偶数 的 结果 。 

5. 在 上 述 的 2 一 4 题 中 注 及 到 的 各 组 随机 事件 中 ,哪些 互 不 相 容 .哪些 相互 独立 ? 

6. 两 个 独立 事件 之 和 的 概率 与 这 两 个 事件 的 概率 是 什么 关系 了 

7. 一 次 投 出 两 个 山子 , 朝 上 的 一 面 点 数 相 同 的 概率 有 过 大 ? 


| 
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8. 有 10 道 * 四 选 一 ”的 选择 题 , 考 生年 猜 测 做 对 5 题 的 概率 有 客 太 ? 

9. 某 研究 者 从 某 高 校 大 一 500 名 学 生 ( 其 中 男生 200, 妈 生 300) 中 随机 抽取 了 100 
名 学 生 ( 其 中 男生 45; 女 55) 作 为 研究 样本 。 请 问 ; 

(1) 每 一 名 男生 被 抽 中 的 概率 是 多少 ? 每 一 女生 被 抽 中 的 概率 是 才 少 ? 

(2) 在 每 一 次 抽取 中 , 抽 中 男生 的 概率 是 多 少 ? 抽 中 女生 的 概率 是 多 少 ? 

(3) 该 研究 者 抽 中 男生 的 频率 是 老少 ? 抽 中 女生 的 频率 是 老少 ? 

(4) 如 重新 抽样 ,男生 和 和 女生 的 抽 中 概率 会 改变 吗 ? 抽 中 频率 会 政变 吗 ? 

10. 假如 啤酒 三 生产 的 啤酒 中 ,每 1000 眶 啤酒 有 10 撼 内 芋 印 有 "“ 金 "、10 眶 内 普 印 有 
“ 放 ” .10 壮 印 有 " 干 ", 剩 下 的 印 有 "谢谢 品 上 党" ,次 齐 一 个 “ 金 , 陵 , 干 "三 字 就 可 获得 价值 
100 无 的 一 等 殖 。 如 果 连 喝 三 瓶 , 获 得 一 等 玖 的 慨 率 是 凶 少 ?” 连 获 三 个 "谢谢 品尝 "的 概 
率 是 包 少 ? 

11. 在 追击 犯罪 嫌疑 人 的 过 程 中 ,由 于 嫌疑 人 举 枪 向 无 素 和 群众 开 枪 , 致 鸽 三 名 警察 同 
时 间 其 开 枪 ， 假如 警察 的 命中 率 分 别 为 90 归 .8 上 .60 上 ,那么 该 犯罪 嫌疑 人 被 击 中 一 
枪 ,两 枪 ,三 枪 或 未 被 击 中 的 概率 各 为 密 少 ? 

12. 有 4 个 学 生 一 起 去 参加 一 项 过 关 测 试 ,他 们 每 个 人 能 通过 的 概率 均 为 0.6, 请 间 
他 们 4 大 中 能 有 三 人 通过 的 概率 是 名 大 ? 

13. 某 人 随意 地 投 括 骨 子 8 次 ,请 问 : 

[1) 点 数 为 5 的 一 面 朝 上 的 次 数 可 能 会 是 凶 少 ? 

42) 点 数 为 5 的 一 面 朝 上 的 次 数 为 3 的 概率 是 多 少 ? 

(3) 点 数 在 4 以 上 (包括 4) 的 面 朝 上 的 次 数 可 能 会 是 多 少 ? 

(4) 点数 在 4 以 上 的 面 朝 上 的 次 数 为 2 的 概率 是 多少 7? 

14. 已 憩 半 服从 均值 为 ,标准 差 为 o 的 正 态 分 布 , 查 " 正 态 分 布 的 PZY 转换 表 ” 计 算 
以 下 概率 ， 

《1 Pip—1,860< 1, B60}: 

(2) Plu—3. Sept+3. S50), 

15. 某 公司 组 织 招聘 考试 ,考试 成 绩 平 均 分 为 ?0 分 ,标准 差 为 12 分 。 著 这 次 招聘 人 
数 占 应 聘 者 的 比例 大 约 控制 在 16%, 在 不 查 正 态 分 布 表 的 情 沈 下 来 确定 最 低 录 取 分 数 线 
太 概 要 控制 在 什 和 读 位置 tf 已 若 ;:Z=1 时 ,P=34131Z=2 时 .P=.4772;Z=3 时 ,P= 
:987)。 

16. 已 知 某 班 期 未 考试 中 语文 的 平均 分 80, 标 淮 差 10 分 ;数学 平均 70 ,标准 益 15; 莫 
十 平均 55 ,标准 差 为 12。 甲 生 的 语文 成 绩 为 80 分 .数学 是 分 .英语 成 绩 9 分 。 该 生 三 
科 成 绩 中 哪 一 门 最 好 ? 

17. 某 市 参加 数学 奥林匹克 业余 党校 人 学 考试 的 人 数 为 2800 人 ,只 录取 学 生 150 
人 ,该 次 考试 的 平均 分 为 75 分 ,标准 差 8 分 。 问 录取 分 数 线 应 定 为 未 少 分 ? 
18. 有 800 人 参加 智力 测验 ,向 分 为 了 个 等 级 , 问 各 评定 等 级 的 大 数 是 多少 较为 
音 通 ? 


,| 





第 四 章 ”抽样 分 布 与 参数 估计 





(Gare 


所 谓 拍 样 分 布 ,就 是 样本 统计 量 的 概率 分 布 ， 根 据 抽样 分 布 的 原理 ,我 们 可 以 进行 参数 舍 
计 ， 泰 数 信 计 分 为 两 种 :一 种 是 点 属 计 , 即 直 接 用 样本 统计 量 必 为 相应 总 体 大 数 的 居 计 值 ; 另 
一 种 是 区 间 估 计 , 即 在 一 定 把 握 程 度 上 给 出 一 个 可 能 涵盖 总 体 套数 的 范围 ,这 个 范围 叫做 置信 
区 间 。 置 们 区 间 涵 盖 总 体 和 参数 的 概率 叫做 置信 度 。 环 章 在 对 抽样 分 布 的 概念 进行 细致 阐述 
之 后 ,讨论 了 和 如何 利用 标准 正 态 Z 分 布 和 非 正 坊 的 上 分 布 进行 总 体 秦 数 一 总 体 平 均 数 的 
区 间 估 计 , 讨 论 了 上 上 分布 与 己 分 布 之 间 的 关系 ,同时 介绍 了 夭 数 区 间 估 计 的 SPSS 过 程 ， 


在 心理 学 或 其 他 行为 科学 领域 中 ,研究 者 想 了 解 的 往往 是 某 个 总 体 的 心理 或 行为 特 
征 ,而 不 是 少数 人 组 成 的 样 末 的 特征 ,但 是 又 几乎 都 要 从 观察 样本 开始 。， 例 如 ,一 位 儿童 
心理 学 家 试图 了 解 0 一 6 崔 支 儿 的 创造 潜质 。 从 理论 上 说 ,他 应 该 对 所 有 0 一 6 崇 幼 儿 进 
行 全 面 的 创造 力 潜质 测量 ,但 "0 一 6 崔 幼 儿 " 是 一 个 府 太 的 总 体 , 要 想 对 其 中 的 每 一 个 体 
都 进行 观测 ,从 研究 的 财力 ,物力 ,人力 来 说 都 是 不 可 能 的 ， 因 此 ,只 能 从 总 体 中 选取 一 
部 分 个 体 组 成 * 有 代表 性 "的 样本 ,然后 对 样本 进行 观测 和 研究 ,再 将 观测 结果 推论 到 总 
体 , 进 而 估计 总 体 的 参数 ,推断 总 体 的 特征 与 规律 。 事 实 上 ,统计 学 建立 了 系统 的 随机 抽 
样 理论 和 统计 推断 方法 ,为 这 样 的 研究 提供 了 强 有 力 的 科学 你 障 。 


生硬 和 和 于 卉 于 上 匠 二 史 甘 昔 ” 届 目 洗 


第 一 节 抽 笠 人 分布 


用 样本 资料 去 推断 总 体 特征 ,关键 的 问题 就 是 要 在 抽样 中 保证 样本 的 代表 性 。 为 此 
第 一 章 中 不 仅 介 绍 了 一 些 有 将 的 抽样 方法 ,而 且 强调 抽样 中 要 充分 地 贯彻 随机 性 原则 。 
所 谓 随机 性 原则 ,是 指 总 体 中 的 每 一 个 体 都 有 独立 的 ,相等 的 被 抽 中 机 会 。 按 照 随机 性 
原则 抽取 样本 ,可 以 在 一 定 程度 上 排除 研究 者 主观 意志 或 偏好 对 研究 结果 的 影响 , 既 能 
便 料 本 数据 的 分 布 类 似 于 总 体 数据 分 布 ,又 能 使 样本 数据 满足 统计 学 方法 的 要 求 ,进而 
可 以 利用 统计 学 的 手段 和 方法 进行 统计 推断 。 


一 、 抽 样 分 布 与 抽样 误差 估计 
(一 ) 抽样 分 布 的 定 父 
所 谓 抽样 分 布 ,就 是 指 样本 统计 量 的 概率 分 布 。 


本 
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由 
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在 第 二 章 中 ,我 们 已 经 介绍 过 :样本 的 描述 性 特征 量 叫 做 统计 量 ; 总 体 的 描述 性 特征 
革 叫 做 矢 数 。 从 理论 上 讲 ,总体 参数 是 在 对 总 体 所 有 个 案 进 行 观测 后 得 到 的 ,所 以 它 是 
一 个 确定 的 基 。 但 通常 我 们 只 能 对 样本 中 的 个 案 进 行 观测 ,所 以 得 到 的 特征 量 多 半 都 是 
样本 统计 量 。 但 是 由 于 抽样 本 身 带 有 随机 性 ,所 以 毫 无 疑问 ;如 里 不断 地 重 旧 进行 样本 
抽样 ,每 一 次 得 到 的 样本 都 可 能 是 不 一 样 的 ;每 一 次 抽样 之 后 对 样本 进行 观测 ,就 可 能 得 
到 三 同 的 统计 量 。 由 此 可 见 ,样本 统计 量 是 一 个 变动 的 值 。 

.在 心理 统计 学 中 ;常用 的 统计 量 有 很 多, 如 样本 平均 数 苹 ,样本 标准 差 S. 样 本 间 的 相 
关系 数 " 等 。 如 果 用 字母 革 指 代 某 一 统计 量 ,抽样 分 布 就 是 指 X 的 概率 分 布 , 即 样 未 统 
计量 的 概率 分 布 。 上 有 具体 地 说 ,如 果 从 容量 为 N 的 总 体 中 ,每 次 抽取 容量 为 ”的 样本 ,可 以 
计算 其 统计 基 关 。 每 次 抽取 样本 时 , 抽 到 的 个 案 不 一 定 相 同 .计算 出 来 的 统计 量 X 也 不 
尽 相 同 , 如 此 一 直 进 行 下 去 ,直到 穷尽 了 所 有 可 能 的 容量 为 n 的 样本 之 后 ,就 可 以 得 到 很 
多 其 至 是 无 数 个 统计 蕴 守 。 从 理论 上 讲 , 若 为 不 返回 抽样 可 得 到 Cy 个 统计 量 半 ,车 为 返 
回 抽样 则 可 得 到 更 名 个 - 羡 , 当 N 的 数目 贸 大 态 至 无 穷 时 , 则 站 的 数量 是 庞大 的 . 共 至 是 
几 近 无 限 的 。 当 得 到 了 很 过 个 样 束 统计 量 后 ,就 可 以 将 这 些 统计 量 集 中 在 一 起 构成 一 十 
新 的 数据 总 体 , 这 个 新 的 数据 总 体 也 具有 自己 的 概率 分 布 ,这 个 概率 分 布 就 是 我 们 所 说 
的 抽样 分 布 。 

抽样 分 布 的 形态 因 统 计量 的 不 同 而 不 同 ,最 常 碰 到 的 抽样 分 布 形 态 有 正 态 分 布 .分 
布 : 玉 分布.x 分 布 等 。 除 进一步 在 抽样 分 布 中 介绍 正 访 分 布 的 应 用 外 .本 章 和 将 结合 下 同 
统计 量 抽样 分 布 的 特点 ,重点 介绍 样本 平均 数 的 1 分布 。 yx? 分 布 留 待 第 十 二 章 再 作 
介绍 。 


(二 ) 抽样 误 益 

进行 灾 次 抽样 ,有 是 每 次 抽样 的 样本 容量 均 为 的 时 候 , 就 可 以 观测 得 到 多 个 样本 统 
计量 ,将 这 些 样 本 的 统计 基 集 中 在 一 起 构成 一 个 数据 总 体 时 ,可 以 看 到 ;这 个 总 体 中 , 数 
据 有 具有 上 下 的 随机 波动 性 。 为 评估 这 一 数据 的 随机 波动 性 ,我 们 可 以 计算 该 数据 总 体 的 
标准 老 。 与 前 文 介 绍 的 标准 差 的 性 质 相同 ,样本 统计 量 的 标准 差 也 反映 了 抽样 过 程 中 随 
机 误差 的 大小, 即 抽样 误 装 的 大 小 。 此 类 标准 差 反 映 的 是 样本 统计 量 之 间 的 差异 性 , 统 
计生 :将 其 叫做 "标准 误差 ” ,简称 "标准 误 "(Standard Error, 编 写 为 Sa. 已 或 SP)， 即 称 于 
种 统计 量 抽 样 分 布 的 标准 其 为 该 种 统计 量 的 标准 误 ; 如 样本 平均 数 抽 样 分 布 的 标准 差 可 
直接 说 成 “平均 数 的 标准 误 "(Std，Error of Mean, 简 写 为 SE, mean) ,样本 标准 差 的 抽样 
分 布 的 标准 差 可 直接 说 成 “标准 差 的 标准 误 "。 显 然 , 标 准 谋 越 小 ,表明 抽样 误差 越 小 ,用 
该 样本 统计 量 来 估计 或 推断 相应 总 体 参 数 的 可 靠 性 就 越 高 。 

二 、 样 本 平均 数 的 抽样 分 布 

假如 ,和 将 某 年 参加 全 国 高 考 的 考生 的 数学 成 绩 作 为 总 体 , 从 中 随机 抽取 400 名 考生 
的 数学 成 绩 构成 一 个 样本 ,然后 计算 这 400 各 考生 数学 成 绩 的 平均 分 , 记 为 玉 。 然 后 , 特 
这 400 名 考生 的 数学 成 绩 放 回 到 总 体 中 , 青 重新 随机 抽取 另 一 个 容量 为 400 的 样本 , 豆 
可 计算 出 一 个 样本 平均 分 , 记 为 并; ,oss :不 断 重 复 地 进行 这 样 的 抽样 和 计算 ,就 可 以 得 
到 无 数 个 w= 二 400 的 样本 及 其 平均 分 ,将 这 些 样 本 平均 分 统一 记 作 总 ,它们 组 成 了 一 个 新 
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EP 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 J 重量 归 酒 冉 史 WW 厅 眉 于 营 岗 记 


其 近似 地 看 作 是 正 态 分 布 ,这 是 在 前 一 部 分 讨论 到 的 内 容 。 
当 样 本 容量 m 过 30 时 ,i 分 布 与 正 态 分 布 差异 较 大 ,一 般 不 再 使 用 正 态 分 布 来 进行 相 


应 的 统计 分 析 , 而 是 使 用 + 分布。 此 时 ,yp 一 pos 一 = 守 ,描述 样本 平均 数 抽样 分 布 的 统 





计量 上 可 采用 以 下 公式 计算 





公式 4-3) 
Se ‘公式 

公式 4-3 计 算出 来 的 统计 量 服从 自由 度 为 4 一 1 的 + 人 和 分布。 自由 度 是 统计 学 中 常用 
的 概念 ,是 指 用 者 干 变量 值 计算 某 统计 量 时 ,能 够 自由 取 值 的 变量 值 的 个 数 , 一 般 用 符号 


drtdegree of freedomy 表 未 。 例如 , 当 计 算 世 时 ,由 于 六 三 2 一 二 (Xi 十 部 ;十 …: 十 
,其 中 证 ,XX 是 个 独立 自由 取 值 的 变量 值 ,所 以 这 时 自由 度 为 n, 即 df=n。 
当 计算 号 -一 一 巴 (X 一 下 时 ,由 于 下 既定 , 则 X ,XX ,…,X, 的 取 值 受到 一 个 约 东 ， 


se i 
即 必须 壮 足 衬 三 过 :所 以 这 时 只 有 一 1 个 变量 值 可 以 自由 变动 ,有 1 个 变量 值 是 不 


于 
自由 的 ,此 时 自由 度 为 "一 1, 即 df 一 n 一 1。 或 者 说 ,自由 度 就 是 基于 某 一 变量 的 测量 过 
程 中 , 测 基 结果 发 生变 化 的 次 数 或 机 会 ， 
蔷 于 样本 平均 数 的 抽样 分 布 , 正 态 分 布 和 + 分布 适 用 的 条 人 忻 可 总 结 成 表 4 -1 所 示 。 








表 4-1 样本 平均 数 抽样 分 布 分 析 中 正 态 分 布 和 /分 布 适用 条 件 
| “| 剧本 平均 数 分 布 为 正 态 或 浙 近 正 态 | 样本 平均 数 分 布 为 + 分 布 
本 要 二 本 

| | | 一 


数据 总体 为 下 _ 3 
正 态 分 布 去 样 率 Hy — Hes Hs 一 MO 和 








抽样 分 布 的 统计 量 计算 方法 < i z f= Er 





t 分布 是 姜 赛 特 于 1908 年 提出 来 的 ,当时 他 使 用 的 是 笔名 ”Student , 砚 而 称 之 为 ”/ 
分 布 "。 分 布 是 一 种 连续 分 布 ,其 密度 函数 比较 复杂 ,分 布 曲 线 与 标准 正 态 分 布 曲线 有 
许多 相似 之 处 ,表现 在 ，; 

(ii 分 布 和 标准 正 态 分 布 都 在 基线 之 上 , 值 或 了 值 的 取 值 范围 都 是 (一 扣 一 十 c) 


一 人 





的 数据 总 体 , 即 样本 平均 分 的 抽样 分 布 。 那 么 这 个 抽样 分 布 的 形态 如 何 ? 其 数据 特征 又 
会 怎样 呢 ? 

统计 学 的 研究 表明 ,一 个 抽样 分 布 的 形态 主要 受到 三 个 因素 的 影响 :总 体 的 分 布 形 
态 ( 是 否 正 态 分 布 ) .样本 容量 的 大 小 (大 样本 或 小 样本 ) 、 要 计算 的 统计 量 类 型 (平均 数 
或 方差 /标准 差 等 )。 这 三 个 因素 中 的 任何 一 个 发 生 改变 ,抽样 分 布 的 形态 就 会 随 之 发 生 
变化 。 

数理 统计 学 的 中 心 极限 定理 和 其 他 证 明 为 我 们 提供 了 依据 ,使 我 们 可 以 对 平均 数 抽 
样 分 布 的 特征 做 出 概括 。 样 本 平均 数 抽样 分 布 的 常见 形态 有 正 态 分 布 和 上 分 布 两 种 。 那 
么 ,什么 条 件 下 是 正 态 分 布 ,什么 条 件 下 是 + 分布 ,t 分布 有 什么 特点 ? 

当下 列 条 件 之 一 成 立时 ,X 的 抽样 分 布 为 正 态 或 趋 于 正 态 ; 

(1) 原 数 据 总 体 为 正 态 分布 , 旦 总体 方差 已 知 时 ,不 管 样本 容量 n 是 大 还 是 小 ,XX 


的 抽样 分 布 都 为 正 态 ,样本 平均 数 的 数学 期 望 (平均 数 )y 二 ,样本 平均 数 的 方差 q! = 


2 
天 


或 样本 平均 数 的 标准 差 mx -万 根据 标准 分 数 的 计算 公式 ,可 通过 公式 4 一 1 将 样本 平 


均 数 的 抽样 分 布 转换 为 标准 正 态 分 布 即 Z 分 布 。 
2 (公式 4-1) 

(2) 原 数 据 总 体 为 正 态 分 布 ,但 总 体 方差 #* 未 知 时 ,平均 数 的 抽样 分 布 不 完全 符合 
正 态 分 布 。 但 在 样本 容量 足够 大 (一 般 mn 二 30) 时 ,该 分 布 会 趋 于 正 态 , 可 以 近似 地 将 其 看 
作 正 态 分 布 。 因 为 在 总 体 方差 未 知 的 情况 下 ,无 法 使 用 总 体 方差 来 计算 样本 平均 数 的 标 
准 差 即 标准 误 , 所 以 只 能 使 用 样本 方差 或 标准 差 作为 估计 值 替代 总 体 方差 或 标准 差 。 可 
以 先 根据 第 二 章 中 介绍 的 标准 差 公式 计算 样本 标准 差 , 然 后 估计 样本 平均 数 的 标准 
误 。 即 : 
S 
万 

然后 ,可 以 运用 公式 4- 1 将 样本 平均 数 的 抽样 分 布 转化 为 标准 的 正 态 分 布 。 

(3) 当 原 数据 总 体 为 非 正 态 分 布 时 ,只 有 当 样 本 容量 足够 大 (一 般 "一 30) 时 ,平均 数 
的 抽样 分 布 才 会 趋 于 正 态 ,此 时 

o 


Lr 一 AGOx 二 (已 知 的 情况 ) 


mg 一 (公式 4-2) 


或 
Po 和 (a 未 知 的 情况 ,用 样本 的 标准 差 估计 标准 误 ) 


然后 ,可 以 运用 公式 4 - 1 将 样本 平均 数 的 抽样 分 布 转化 为 标准 的 正 态 分 布 。 

当 原 数据 总 体 为 正 态 分 布 ,但 o 未 知 ,XX 的 抽样 分 布 为 + 分 布 ,t 分 布 的 形态 与 样本 
容量 n 的 大 小 有 关 。 一 般 来 说 ,n 越 大 ,1 分布 越 接近 于 正 态 分 布 ,特别 是 当 欧 于 无 穷 大 
时 ,t 分 布 与 正 态 分 布 重合 。 

在 实际 使 用 中 , 当 样本 容量 n 二 30 时 ,t 分 布 与 正 态 分 布 的 差异 性 较 小 ,所 以 可 以 将 


ee@ 和 四 工读 疏 呆 斗 未 苍 埋 ” 贡 盏 将 
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(2 以 平均 数 0 为 中 心 , 左 侧 取 值 为 负数 , 右 侧 取 值 为 正 数 ;:(3) 曲 线 都 是 以 中 心 为 最 高 ， 
两 端 向 左右 无 穷 延 伸 ,逐渐 下 降 , 但 与 工 轴 未 不 相交 。 

随 着 自由 度 不 同 ,t 分 布 曲线 旦 一- 馈 分 布 形态 。 当 自由 度 较 小 时 ,t 分 布 的 分 散 程度 
比 标准 正 态 分 布 要 太 得 多 ,密度 函数 曲线 比较 平缓; 随 着 自由 度 逐 渐 增 大 ,t 分 布 曲 线 连 
渐 接 近 标 准 正太 分布, 其 极限 分 布 为 标准 正 态 分 布 ,如 图 4-1 所 示 的 就 是 目 由 度 不 同时 
的 一 组 上 分布 曲线 。 


ne 





图 4=1 一 组 自由 度 科 同时 的 1 向 布 曲 如 

与 正 态 分 布 PZY 表 的 功能 近似 , 附 表 3 为 上 值 表 ,给 出 了 三 个 变量 之 间 的 关系 和 数 
据 : 左 侧 最 边缘 一 列 为 自由 度 世 F, 最 上面 一 行 是 :分 布 上 对 应 于 不 同上 值 的 两 个 尾 端 部 
分 面积 之 和 。 

下 边 ,用 两 个 例题 来 说 明 平 均 数 抽样 分 布 的 具体 应 用 ,并 比较 ZZ 分 布 和 1 分 布 的 
不 同 。 

【 例 4-1 已 知 革 次 全 区 数学 统考 成 绩 服从 正 态 分 布 , 总 体 平 均 分 为 70, 标准 莽 为 
10。 现 从 全 区 考生 中 抽取 一 个 容量 为 25 的 简单 随机 样本 , 试 估 计 一 下 这 一 样本 的 平均 
分 从 于 68 一 72 之 间 的 可 能 性 有 过 大 。 

[ 解 】 因为 数学 成 绩 的 总 体 呈 正 态 分 布 , 总 体 方 差 已 知 , 所 以 样本 平均 数 符 合 正 态 
分 布 。 


根据 公式 4 一 1 可 得 : 








如 果 样 本 平均 数 为 X62 
了 志 
如 果 样 本 平均 数 为 X72,2— 


所 以 样本 平均 数 在 68 一 ?72 的 区 间 正 好 是 平均 数 抽样 分 布 中 的 区 间 ZEL 一 1,1]， 查 
附 表 2 的 正 访 分 布 表 可 知 ,ZEL0,1] 区 间 的 面积 为 0, 34134, 故 ZEL[ 一 1,1j] 区 间 的 面积 
为 0, 68268。 

所 以 ， PP(68 二 光 过 72) 一 呈 ( 一 1 过 2 二 1] ) 一 0 68268 

即 所 抽样 本 平均 数 在 68 一 72 间 的 可 能 性 约 为 68.3 啊 。 

【 例 4-2] 已 知 某 次 全 区 数学 统考 的 成 绩 服 从 正 态 分 布 ,其 总 体 平均 数 为 70 分。 
现 从 全 区 考生 中 随机 抽取 了 25 名 考生 的 成 绩 构 成 样本 ,该 样本 分 数 的 标准 差 为 10。 试 
估计 这 一 样本 的 平均 分 介 于 68 一 72 之 间 的 可 能 性 有 包 太 。 

【 解 】 因为 数学 成 绩 总 体 呈 正 态 分 布 ,总 体 方差 未 知 ,n 二 25 过 30, 样 本 平均 分 符合 : 


下 生生 各 寺村 六 圳 时 襄 守 各 合 霹 固 汀 





一 2 和 希 蜗 让 同 久 人 太 刁 钾 时 六 和 于 和 营 肝癌 





分 布 。 


0 


根据 公式 4-3 可 得 ， 
如 果 样本 平均 数 为 。 束 = 68, 一 全 -4 一 至 一 一 1 


Fy 
如 果 样 本 平均 数 为 又 -72 一 二 4 一 下 一 1 
机 

查 附 表 3 的 + 值 表 ; 当 df==25 一 1=24 时 ,t= 证 0. 857 时 ,+ 分 布 两 个 尾部 面积 为 
0.4, 即 1 分 布 上 一 0.857<<1<<0.857 区 间 的 面积 为 0. 60; 同 样 方法 得 到 , 分 布 上 一 1. 059 
三 1 三 1.059 区 间 的 面积 为 0.70。 根 据 上 述 计算 ,样本 平均 数 在 68 一 72 区 间 时 ,一 1 过 :二 
1, 如 图 4-2 所 示 , 该 区 间 的 宽度 介 于 一 0. 857 志 + 三 0, 857 和 一 1.059 近 1 二 1.059 的 宽度 
之 间 , 所 以 其 面积 介 于 0.60 与 0.70 之 间 。 于 是 得 到 样本 平均 数 介 于 68 一 ?2 之 间 的 概率 
是 :0. 60 二 P68 过 之 72) 二 0.70, 即 所 抽样 本 平均 数 在 68 一 72 间 的 可 能 性 在 60 色 至 
70 区 之 间 。 





——| 039 人 1.059 
图 二 -2 了 上 骨 在 -1--1 区间 【区 布 晶 效 下 的 面 竹 


第 二 节 ”参数 估计 的 基本 原理 


心理 学 研究 中 ,很 各 时 候 研 究 者 无 法 知道 某 个 总 体 的 参数 ,无 从 知晓 一 个 总 体 的 参 
数 与 习 一 个 或 姑 几 个 总 体 的 参数 有 无 明显 差异 。 这 时 ,就 可 以 采用 随机 抽样 的 方法 ,从 
总 体 中 抽取 一 定 容量 的 样本 进行 资料 分 析 , 然 后 用 样本 统计 量 对 总 体 参 数 进行 估计 或 推 
论 。 推论 的 依据 就 是 抽样 分 布 理论 与 小 概率 推断 原理 ,统计 推断 主要 有 两 种 方式 :一 为 
参数 合计 ,二 为 假设 检验 。 本 章 先 以 总 体 平均 数 的 估计 为 例 介 绍 参 数 估 计 的 一 般 过程 。 


一 、 参 数 估 计 的 概念 


时 了 解 什么 是 参数 估计 ,必须 首先 了 解 几 个 概念 :51) 待 佑 参数 ,是 在 参数 估计 中 要 
合计 的 那个 总 体 的 参数 , 它 可 以 是 平均 数 j, 也 可 以 是 方差 a 或 其 他 参数 ,可 统一 用 0 来 
表示 352 合计 量 , 是 指 用 来 佑 计 参 数 的 样本 统计 量 ,比如 样本 平均 数 . 中 位 数 . 标 准 差 等 ， 


古 王 三 性 


统一 用 户 表 示 :f3? 估 计 值 .是 指 可 以 根据 样本 数据 计算 出 来 的 统计 量 的 值 ,也 统一 用 8 
表示 ， 

所 以 ,参数 估计 就 是 确定 待 估 参 数 . 估 计量 与 估计 值 之 间 的 美 系 。 用 数学 语言 来 表 
述 ,就 是 ; 设 总 体 挟 有 参数 9, 现 根据 该 总 体 一 个 随机 样本 CX ,XX ，… ,XX,) 计 算出 来 的 统 
计量 作为 佑 计量 站 去 估计 总 体 参 数 0。 

参数 估计 有 两 种 不 同 的 任务 或 方式 , 即 点 估计 和 区 间 估 计 。 点 估计 ,就 是 直接 用 样 
素 统 计量 测量 变量 连续 体 中 的 一 个 点 ,作为 相应 总 体 参 数 的 估计 值 ,所 以 叫做 点 估计 。 
具体 做 法 是 先 根据 样本 的 一 系列 个 案 观察 值 , 计 算 统 计量 ,该 统计 量 就 是 总 体 参 数 4 的 点 
估计 六 

区 间 估 计 ,就 是 根据 样 末 中 一 系列 个 案 的 观察 值 计 算出 两 个 估计 量 名 和 总, 将 区 间 
(全 ,如 } 作 为 参数 8 可 能 的 取 值 范围 ,并 同时 指出 该 区 间 包 含 参 数 0 的 可 能 性 (概率 )。 


二 、 良 好 的 点 估计 量 的 特征 


对 于 同一 个 未 知 的 总 体 参 数 来 说 , 它 可 以 用 不 同 的 样本 统计 量 作为 估计 基 . 例如 ， 
对 总 体 平 均 数 六 的 估计 ,上 既 可 以 用 样本 平均 数 反 作为 估计 量 , 也 可 以 用 样本 中 位 数 M, 或 
样本 众 数 M, 来 作为 悄 计 有 量 。 代 是 ,不 同 统 计量 的 性 质 和 计算 方法 是 不 同 的 ,在 反映 样本 
中 的 观测 信息 方面 差异 也 很 大, 所 以 不 同 统计 量 作 为 参数 个 计量 的 时 候 , 具 有 品质 上 的 
差异 。 一 般 来 说 ,一 个 良好 的 点 帖 计量 应 具备 下 列 几 个 主要 特征 :无 偏 性 .有 效 性 .一 至 
性 和 充分 性 。 


(一 ) 无 偏 性 

所 亩 无 偏 性 ,并 不 是 要 求 用 统计 量 去 估计 参数 时 没有 误差 。 根 据 抽样 分 布 原理 , 作 
为 估计 量 的 统计 量 也 是 一 个 随机 变量 ,抽取 不 同 的 样本 就 会 得 到 大 小 不 同 的 估计 值 ,而 
这 些 估 计 值 一 般 是 与 待 估 参 数 之 间 存 在 一 定 偏差 的 ,有 的 估计 量 可 能 会 对 参数 形成 高 
估 , 有 的 估计 量 可 能 会 对 参数 形成 低估 。 当 然 , 如 果 用 很 多 个 样本 进行 很 多 次 的 估计 , 然 
后 平均 , 则 估计 误差 会 在 一 定 程度 上 相互 抵消 或 被 平均 掩 ， 把 所 有 可 能 的 样本 统计 量 都 
计算 出 来 ,就 得 到 一 系列 所 有 可 能 的 参数 估计 值 ; 将 这 些 估 计 值 平 均 , 就 可 最 大 限度 地 平 
衡 误 差 。 如 果 作 为 统计 量 的 估计 量 ,其 抽样 分 布 的 平均 数 实际 上 等 于 待 估 参 数 时 ,那么 
六 估计 量 就 是 待 估 参 数 的 无 偏 估计 量 。 
数理 统计 学 已 经 证 明 , 总 体 平均 数 的 最 佳 无 偏 估 计量 是 样本 平均 数 久 ,总 体 方差 
一 的 最 佳 无 偏 估 计量 是 样本 方差 S:_，， 
下 强调 一 下 :在 不 做 专门 说 明 的 情况 下 ,本 书 中 用 S 表示 样本 方差 时 ,就 是 指 S: ，。 


CX 
因为 在 计算 一 组 数据 方差 时 ,其 自由 度 正好 是 df 一 n 一 1 公式 5.1 一 之 





— XX) 
ee 


内 一 


的 是 一 组 数据 离散 程度 2 (X 一 芒 )* 的 平均 值 ,所 以 该 计算 结果 才 是 最 符合 方差 内 涵 的 。 


(二 ) 有 效 性 
对 于 某 一 个 待 居 参 数 来 说 ,可 能 有 不 止 一 个 无 偏 居 计量 。 比 如 对 于 来 说 ,下 是 一 个 


一 一 一 一 一 一 一 一 一 一 一 * 重 鲁 关 斗 太 要 吴 果 计 由 共 苹 才 因 六 








一 一 一 一 一 一 一 一 一 一 二 类 蝇 曾 天 同 帮 的 可 的 要 性 站 姻 阅 记 


友情 估计 量 ,Mi 也 是 一 个 无 偷 估 计量 ,但 是 哪 一 个 帖 计量 更 “好 "一 些 呢 ? 这 就 是 情 计 量 
的 有 效 性 问题 。 统 计 学 上 认为 ， 人 和 如 , 著 这 两 个 属 
计 量 的 所 有 可 能 结果 的 方差 6 二 和, 那 笃 就 称 筷 是 较 记 有效 的 佑 计量。 也 就 是 说 ,如 
果 某 - po 该 参数 的 所 有 其 他 无 偏 帖 计量 相 比 为 最 小 , 那 各 
该 佑 计量 就 可 称 为 最 有 效 估 计 基 芭 最 佳 雹 低估 计 夸 。 样 本 平均 数 是 总 体 平 均 数 的 最 佳 


无 偏 估 计量 (可 以 证 明 , 样 本 平均 数 的 方差 吧 = 全 ,样本 中 位 数 的 方差 为 败 , 王浆 0 0 
om。 所 以 ,作为 总 体 套数 p 估计 是: 称 本 开 双 老大 本 古 机 


(三 ) 一 致 性 

一 致 性 ,是 要 求 当 样本 容量 逐渐 增 太 时 ,这 个 估计 基 就 越 接近 总 体例 数 ,是 渐进 的 ， 
不 能 有 停止 或 倒退 ,用 数学 方式 来 描述 就 是 : 设 8 为 待人 悄 参 数 8 的 无 偏 估 计量 ,车 mc 
时 恰 收 敦 于 8， 即 liml 一 #8, 这 时 可 称 间 为 8 的 一 至 性 佑 计量。 


(四 ) 充分 性 

如 果 一 个 估计 量 充 分 地 利用 了 样本 提供 的 所 有 与 待 估 参数 有 关 的 信息 ,那么 该 估计 
量 就 被 称 为 是 充分 佑 计量。 例如 ,样本 平均 数 就 是 总 体 平均 数 的 充分 个 计量 ,因为 样本 
所 有 的 观察 值 都 要 参加 样本 平均 数 的 计算 ， 相 比 之 下 ,样本 中 位 数 就 不 是 一 个 充分 的 估 
计量 ,因为 它 的 计算 过 程 中 设 有 用 到 所 有 的 观察 值 。 


三 、 区 间 估 计 的 原理 


Wm dn ddd a ate 直接 , 但 由 点 估计 得 到 的 估计 值 与 总 体 参 
数 的 真 值 之 间 总 是 存在 一 定 偏差 , 这 个 偏差 有 过 大 无 法 估计 。 所 以 , 统计 学 家 们 采用 区 
间 估 计 的 方法 来 解决 这 个 问题 。 实 际 应 用 中 常 采用 区 间 佑 计 。 

所 谓 区 间 悦 计 , 就 是 以 抽样 分 布 原理 为 基础 ,根据 样本 资料 悄 计 出 总 体 参 数 可 能 
出 现在 什么 范围 ,同时 指出 这 个 范围 涵盖 总 体 参 数 的 概率 有 雪 大 。 因 此 区 间 估 计 给 出 

的 就 不 是 总 体 参 数 的 一 个 单一 估计 量 值 ,而 是 一 个 数值 区 间 1 ,六 ) , 这 个 区 间 被 称 为 置 
信 区 间 :六 称 为 置信 区 间 下 限 , 冯 称 为 置信 区 间 上 了 上限。 该 区 间 油 盖 总 体 参 数 8 的 概率 用 1 
一 a 表示, 称 为 置信 和 度 , a 称 为 显著 性 水 平 , 是 一 个 小 概率 ,一 般 & 取 0.05( 妈 5 号 ) 或 者 
0.01( 妈 1%), 则 1 一 a 就 相应 地 也 有 两 个 取 值 : 当 e=0.05 时 ,置信 度 1 一 a=0.95( 即 
85 如 ): 当 a 一 0.01 时 ,置信 和 度 1 一 a 一 0.99( 即 99%)。 置 信和 度 越 大 ,虽然 显著 性 水 平 越 小 
《估计 时 犯错 误 的 概率 , 即 总 体 参 数 不 在 置信 区 间 的 概率 ) ,但 需要 的 置信 区 间 就 越 大 ,估计 
的 精确 度 就 越 小 ， 当 置信 和 庆 升 高 到 1005;% 时 ,置信 和 区间 涵盖 了 参数 可 能 的 全 部 取 值 范围 ,区 
间 估 计 也 就 没有 了 任何 意义 。 所 以 ,在 实际 的 区 间 估 计 过 程 中 ,要 权 本 利 王 , 确 定 合适 的 置 
信和 度 。 

下 面 以 上 总体 平均 数 的 区 间 秸 计 为 便 , 简 单 说 明 区 间 估 计 的 基本 过 程 ， 

设 有 一 正 态 分 布 的 总 体 六 一 和 NG) ,CK XXX 是 从 该 总 体 抽取 的 一 个 简单 
随机 样本 ,其 平均 数 为 芝 。 根 据 前 面 所 述 的 抽样 分 布 理 论 ! 见 表 4- 1) ,无数 个 从 该 总 体 








抽出 的 容量 为 ”的 样本 ,其 平均 数 服从 正 态 分 布 , 且 ps 一 Ar 四 一 乞 , 即 总 一 N (pz, 扩 ) ,如 


图 4-3 所 示 ， 

根据 正 态 分 布 的 特点 ,平均 数 上 下 1. 96 
个 标准 差 之 间 包 全 了 全 体 数 据 的 85 啤 。 按 照 
抽样 分 布 的 规律 ,随机 地 从 总 体 中 抽取 一 个 容 
量 为 1 的 样本 ,其 样本 平均 数 六 有 95 籽 可 能 性 
落 在 总 体 平均 数 上 下 1. 96 个 标准 误 之 内 , 即 











p(n—1. 967 < 让 之 py 十 1. 96awy) 一 0.95, 将 其 。 ! Et. D60y 
转化 成 标准 正 态 分 布 来 表示 就 是 Pt 一 1. 96 二 图 4-3 区 间 售 计 原 理 示 意图 
2Z<1.96)=0.95, z=2—&. 
a 5, 其 中 了 
所 以 ， P| -1.9< < 6 |=0 95 
本 ni 
代数 变换 后 即 可 得 到 ， 
P{R—1.96 生 一 /一 吏 十 1.96 生 | 一 0. 95 (从 起 4 一 4) 
(Rr 全 | 
公式 4-4 说 明 ,总 体 参 数 六 有 95 站 的 可 能 是 处 在 | 束 一 中 ,和 +1.96 后 | 区间 兴 
局 机 
内 ,或 者 说 ,| 一 1.96 所 ,天 十 1.96 上 区 间 有 95% 的 可 能 性 涵盖 了 总 体 参数 的 位 置 ， 并 
布 
该 区 间 为 总 体 平均 数 wz 的 置信 度 为 95% 的 置信 区 间 ,其 忱 信 下 限 为 X 一 1, 96 - 乒 , 置 信 上 2 
全 
为 页 十 1. 96 区 ， 计 
限 为 1.96 -全 。 
同 理 可 以 得 到 ， - 
P(X—2. 58 + 后 )=0 99 (公式 上 -5) 
一 2.58 -后 , 双 二 2.58 上 三 | 为 总 体 平均 数 # 的 置信 度 为 99 中 的 置信 区 间 , 其 置信 下 
为 忘 一 2. 58 二 ,置信 上 限 为 不 十 2,. 58 -一 。 
限 少 其 一 Wy 置信 上 限 为 入 人 
以 上 所 举 的 是 误 抽 样 分 布 为 正 态 分 布 时 的 情况 。 如 果 和 抽样 分 布 丰 是 符合 正 态 分 
布 ,而 是 符合 上 分 布 , 其 置信 区 间 叉 该 如 何 进 行 怕 计 呢 ? 
第 三 节 总 体 平 均 数 的 区 间 估 计 


论 各 种 情况 下 的 总 体 平 均 数 的 区 间 佑 计 。 


只 要 知道 了 样本 平均 数 的 抽样 分 布 形态 (是 正 态 分 布 还 是 + 分布), 就 可 以 根据 抽 
分 布 理 论 和 概率 分 布 的 性 质 , 选 择 一 定 的 置信 度 对 总 体 平均 数 yx 懒 出 区 间 司 计 ， 了 


WW 悚 和 于 民风 局 





一 、 总 体 正 态 且 方 差 已 知 时 的 区 间 居 计 
数据 总 体 为 正 态 分 布 , 且 总 体 方差 已 知 的 条 件 下 ,总 体 平均 数 的 区 间 佑 计 是 最 简 
单 的 情况 。 当 要 求 秆 信和 度 为 95% 时 ,有 P( 玉 一 1. 96 号 <w<X+1.96 二 ) 一 0.951 要 求 


置信 度 为 99 站 时 ,有 已 (六 一 2. 58 所 下 2.58 三) 一 0.99。 将 这 一 过 程 推广 到 任意 
二 于 
的 置信 和 度 Il—a 时 ,有 : 
P(X-Z1X ER EE) (公式 4 一 6) 
【 例 4-3] 某 省 区 成 人 男性 身高 服从 正 态 分 布 ,已 知 总 体 标 准 差 15cm。 从 金 省 成 
人 汶 性 中 随机 抽取 100 人 ,测量 得 到 他 们 的 平均 身高 为 166cm。 试 估计 在 95 吕 置信 和 度 
下 ,全 省 成 人 男性 身高 的 置 全 区间。 四 
〖【 解 了 已 知 六 ~Nigno)g=15,n 二 100, 让 =166,1 一 ge 二 95 妖 
所 局 a=0.05,2, = .2,0 =]. 9 
根据 会 武 4-6 得 到 ， 


| 15 15 
Pl166—1.96 xX—————< p166+1. 96X——— |=0., 95 
| O00 : | 
即 P(t163.06< p168. 94)=0, 95 


故 上 总体 平均 数 py 在 0.95 电信 和 度 下 的 性 信和 区 间 为 {163, 06,168. 94}。 
二 、 总 体 正 态 但 方差 未 知 时 的 区 间 估计 


数据 总 体 为 正 态 分 布 ,总 体 方差 未 知 的 条 件 下 ,下 的 抽样 分 布 为 ! 分 布 。 区 间 估计 
的 基本 过 程 与 正 态 分 布 条 件 下 类 似 。 除 采用 :分 布 外 ,还 要 使 用 样本 标准 差 5S 作 为 总 体 


参数 v 的 估计 值 来 计算 标准 误 SE 二 志 于 是 得 到 ,总 体 平均 数 区 间 估 计 的 公式 为 ， 


而 
P(X Xl (公式 44-7) 
因为 1 分 布 受到 自由 度 太 小 的 影响 ,所 以 计算 1 值 需要 计算 自由 度 : 
df=n—] (公式 4 一 8) 


但 是 , 当 样 本 容量 足够 大 时 (一 般 要 求 x 二 30) ,样本 平均 数 的 分 布 近似 于 正 态 分 布 ， 
此 时 也 可 以 按照 正 态 分 布 的 性 质 计算 总 体 平均 数 的 置信 区 间 , 邯 ， 
P(X—2s Xp Zs Xx) (公式 4 -9) 
【 例 4- 4] 已 知 智力 测验 的 分 数 服从 正 态 分 布 , 某 一 25 名 学 生 样 本 的 平均 智商 为 
105, 标 准 差 为 15, 试 估计 该 样本 所 在 学 生 总 体 平均 智商 的 大 概 范围 ,要 求 估计 的 把 握 度 
达到 99”。 
【[ 解 】 总 体 符合 正 态 分 布 ,样本 容量 "一 25, 为 小 样本 ,样本 平均 数 双 = 105, 标 准 差 


3=15。 


学 避 三 


要 求 区 间 情 计 术 到 的 置信 和 度 为 :1 一 a 一 99%, 所 以 a 二 0.01 
因为 df==# 一 1 二 25 一 1] 二 24 时 ,14 二 tu2 一 2.797 
根据 公式 4-7, 则 


P(105—2,797X jp<105+2,797 十 - 
a 


= 99 
P(96.61< 一 Ap< 113. 39)= 99% 

该 样本 所 在 学 生 总 体 智 商 的 平均 值 有 993% 的 可 能 性 在 195, 51,113. 39} 的 区 间 内 。 

[ 例 4-5] 若 [ 例 4-4 中 样本 人 数 为 04, 其 他 条 件 不 变 , 计 算 总 体 平均 智商 的 99% 
置信 区 间 

【 解 〗 当 "一 64 时 ,样本 为 大 样本 ,不 的 抽样 分 布 近似 于 正 态 分 布 ,此 时 既 可 以 用 ? 
分 布 来 进行 区 间 估 计 , 也 可 以 用 正 态 分 布 来 进行 区 间 估 计 。 

若 用 1 盆 布 , 则 当 df=n 一 1=64 一 1=683 时 ,ts 一 41.0111 二 2.658 

根据 公式 4-7: 有 


。 15 gi E 15 
三 一 上 斌 一 一 1 | 本 一 二 二 
Pl10 2. 658 J 105 二 2. 658 | 9 


即 Pl00.02< p109, 98) =99%” 
教 该 样本 所 在 的 学 生 总 体 平均 智商 的 99 听 置信 区 间 为 (100. 02,109. 98})。 
车 用 正 态 分 布 , 则 当 a=0.01 时 ,2Z,w 二 Zoo 二 2.58 
根据 公式 4 一 9, 有 
5 ~ ne 5 
P|105 2. 58X 105 +2. 58X)=99% 


即 : P(l00, 16<p<109, 84)=99% 

故 该 样本 所 在 学 生 总 体 平均 智商 的 99 中 置信 区 间 为 {100. 16,109. 84}。 

比较 上 述 在 大 样本 情况 下 ,根据 :分 布 和 正 态 分 布 所 作出 的 总 体 平均 数 的 区 间 居 计 
娠 果 ,可 以 看 到 ,二 者 的 差别 不 大 ,其 中 根据 + 分 布 所 作 的 估计 区 间 稍 微 宽 一 些 。 


三 、 总 体 非 正 态 且 方差 已 知 时 的 区 间 估 计 


在 总 体 为 非 正 态 分 布 且 已 知 的 情况 下 ,车 抽取 的 样本 和 容量 较 小 , 则 样本 平均 数 的 
抽样 分 布 也 是 非 正 态 的 。 没 有 什么 分 布 本 数 可 以 对 此 加 以 描述 ,因此 ,无 法 进行 区 间 估 
计 。 但 随 着 样本 容量 的 增 大 ,样本 平均 数 的 抽样 分 布 趋 于 正 态 分 布 。 因 此 ,大 样本 情况 
下 ,可 以 用 正 态 分 布 理论 进行 近似 地 区 间 估 计 , 即 用 公式 4-6 进行 区 间 居 计 。 

【 例 4-6] 已 知 某 种 心理 测验 的 分 数 不 服 从 正 态 分 布 , 其 总 体 标 准 差 为 4 分， 现 从 
参加 该 项 测验 的 大 学 生 中 随机 抽取 64 名 ,其 测验 的 平均 得 分 为 102。 试 求 参加 测验 的 全 
部 大 学 生 的 测验 总 平均 分 的 95 多 置信 区 间 .。 

[ 解 】 本 题 中 ,虽然 总 体 分 布 为 非 正 态 , 但 样本 容量 为 n= 二 64, 属 于 大 样本 。 因 此 XX 
的 抽样 分 布 趋 于 正 态 ,可 以 近似 地 用 正 态 分 布 理论 来 进行 区 间 佑 计 , 即 根据 公式 4-6 计 
算 置 信 区 间 ， 

已 知 吉 一 102,z 一 4 一 ba 一 0.05424 一 2 一 1.96, 代 大 公式 4-6 得 : 


1 
Pp[102—1.96X—< p<102+1. 96X——|—959 
( 人 8) 0 


骼 百代 
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El Pt101. 02< p102. 98)=95% 
故 全 部 大 学 生 测 验 的 总 平均 分 的 95 贤 置信 区 间 为 1101.02,102. 98}。 


四 、 总 体 非 正 态 且 方 差 未 知 时 的 区 间 估 计 


如 时 总 体 为 非 正 态 分 布 , 且 a 未知 ,已 得 测量 资料 及 是 小 样本 , 则 样本 平均 数 的 区 间 
人 入 计 无 法 进行 。 若 抽取 的 是 大 样本 , 则 XX 的 抽样 分 布 接近 1 分 布 ,可 以 利用 “上 分布 来 近似 


地 进行 总 体 平均 数 的 区 间 估 计 。 此 时 := 下 关 ,服从 自由 度 为 n 一 1 的 + 分布。 叉 由 于 大 
wf 于 


样本 时 i 分 布 近 似 于 标准 正 态 分 布 ,因此 也 可 以 直接 用 标准 正 态 分 布 来 解决 间 题 ， 

总 之 ,可 以 利用 公式 4-?7 和 公式 4-9 近似 地 进行 总 体 平均 数 的 区 间 估 计 . 

[【 例 #4-7】 已 知 某 种 心理 测验 的 分 数 丰 服从 正 态 分 布 。 现 从 参加 该 项 测验 的 大 学 
生 总 体 中 随机 抽取 81 名 学 生 , 其 测验 的 平均 分 为 102 分 ,标准 差 为 4 分 。 试 计算 参加 测 
验 的 全 体 大 学 生 测验 总 平均 分 的 85 申 置信 区 间 。 

【 解 ] 总 体 非 正 态 分 布 , 上 且 总 体 方差 未 知 , 但 样本 容量 为 "一 81 ,是 个 大 样本 , 故 可 以 
认为 平均 数 的 抽样 分 布 接近 * 分 布 或 正 态 分 布 。 

X=102,93=4,n=8]; 当 a=0.05,df=80 时 ,1 = wl, 99 

根据 公式 47 可 得 ; 

P(102 一 1 99X- 恒 <p<103 二 1.99X- 大 )=95 色 

即 PC101, 12< 102. 88)=95% 

故 全 体 夫 学 生 测 验 的 总 平均 分 的 95 置信 和 区间 为 {101. 12.102, 88)。 

此 题 也 可 以 用 正 态 分 布 近似 地 进行 估计 , 即 根据 公 式 4-9 可 得 : 


只 汉 -和 i -| 一 1 
Pl102 L986X- p<102+1, 96X -95% 


Bl 

即 Pelo0l. 13< p< 102.87)=95% 

故 全 翌 大 学 生 测 验 总 平均 分 数 的 95% 的 置信 区 间 为 1101. 13.102. 87}。 

以 上 两 种 方法 所 得 置信 区 间 的 差别 生 大 ,实践 中 可 以 任 选 一 种 方法 进行 区 间 估 计 ， 


第 四 节 ”抽样 误差 与 区 间 估 计 的 SPSS 讨 程 


在 使 用 SPSS 系统 进行 数据 分 析 时 ,一般 都 是 直接 针对 样本 数据 展开 的 ,所 以 本 章 中 
所 讨论 的 抽样 分 布 和 区 间 居 计 , 只 能 直接 根据 样本 数据 计算 样本 的 平均 数 和 样本 方差 ， 
然后 据 此 进行 抽样 误差 的 估计 (计算 标准 误 SE) 和 置信 区 间 的 估计 。 

我 们 一 般 假 设 数 据 总 体 是 正 态 分 布 的 ,而 总 体 方 差 通常 都 是 未 知 的 ,所 以 最 具有 一 
般 意 义 的 方法 就 是 使 用 ! 分 布 来 进行 区 间 佑 计 。， 

简单 地 说 ,这 一 部 分 的 SPSS 过 程 主要 有 两 个 任务 :第 一 是 根据 样本 数据 计算 标准 
误 , 它 是 样本 平均 数 离散 程度 的 评估 量 , 也 是 抽样 误差 的 估计 量 : 第 二 是 根据 样本 数据 进 
行 总 体 平均 数 的 置信 区 间 估 计 。 


【 例 4-8] 某 心理 咨询 师 对 所 在 城市 的 高 一 新 生 进行 了 心理 健康 水 平 普 查 。 从 中 
随机 抽取 了 4 名 学 生 的 测验 得 分 如 下 所 示 , 请 居 计 其 抽样 误差 ,并 计算 总 体 平 均 数 的 
95 癌 的 属 信 和 区间， 

抽取 的 40 个 个 案 数据 是 ， 

23 35 21 0 45 台 红 转 允 是 对 弛 3 34 如 
1 
23 33 0 a8 :39 Sl ‘23 ‘30 

【 解 】 利用 SPSS 系统 完成 这 一 分 析 的 过 程 如 下 所 示 : 

步 邓 1: 建 立 SPSS 数据 文件 

未 题 中 只 有 一 个 变量 的 数据 ,而 且 是 连续 型 变量 。 其 数据 文件 建立 的 方法 是 :局 动 
SPSS 系统 ,进入 到 空白 的 数据 编辑 器 ;设置 一 个 变量 名 ,比如 用 Score 作为 变量 名 ;然后 
将 40 个 数据 逐一 输 人 电脑 ,每 个 数据 占 一 行 , 如 图 4-4 所 示 。 





图 上 = 机 ”对 学 生 心 理 健康 测验 芬 数 的 抽样 误 束 及 区 间 居 计 的 数据 交代 


步骤 2: 计 算 标 准 误 SE 

单 击 药 单 "Analvze" 选 择 "*Deseriptive Statistics” 中 的 “Deseriptive "向 令 ,打开 描述 性 
统计 分 析 的 主 对 话 框 ( 对 话 框 示意 图 可 查看 第 二 章 )。 将 变量 “Score " 置 人 "Variables 下 
面 的 方 框 中 ;: 单 击 主 对 话 框 上 的 )ption" 按 钮 打开 对 话 框 , 在 *Option...” 对 话 框 上 勾 选 
标准 误 (S. E. mean) 复 选 框 ,同时 色 选 平均 数 和 标准 差 项 。 单 击 “*Continue" 按 钮 返回 主 对 
话 框 , 单 击 “O 〇 OK" 按 钮 输出 分 析 结 果 , 如 表 4 -2 所 示 ， 


囊 二 -2 Descriplive Statistics 





AN Mean Std, Lheviation 
Sthatlstic Statistic Srd. Error Statistic 
SEOTE 0 0 生 25 必 ,B62 时 时 552 入 
Walid MM clistwiase) 40 





表 4 -2 显示 ,所 抽 学 生 样本 的 心理 健康 测验 分 数 的 平均 值 为 30. 425、 标 准 差 为 
5. 453。 基 于 该 样本 数据 计算 的 抽样 误差 估计 标准 误 (Std, Error) ,等 于 0,862， 
步骤 3: 计算 总 体 平均 数 的 置信 区 间 
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图 和 = 瑟 探索 尾 析 1Explar8l 对 话 框 





图 上 = 和 导 壶 劳 析 中 的 Statistics” 对 语 窟 


输出 分 析 结 果 , 如 表 4-3 所 未。 


Seore 
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单 击 菜单 “Analyze” 选 撞 ”Descriptivwe 
Statistics" 中 的 “Explore" 命令, 打开 探索 分 析 
(‘Explore}) 对 话 杠 ,如 图 4 5 [a 

特 变量 “Score" 置 人 ”Dependent List” 下 的 
方 框 中 ,如 图 4-5 所 示 。 单 击 对 话 框 上 的 “Sta- 
tisties... "按钮 ,打开 对 话 框 .如 图 4 下 所 示 。 

在 “Statisties” 对话 框 上 勾 选 “Descrip- 
tives... 于, 也 加 同时 选中 了 "Confidence lnter- 
val for Neans(t95%) ”的 命令 。 其 中 的 置信 和 座 可 
以 根据 需要 进行 修改 ,比如 改 为 99% 等 ， 单 击 
“Continue 按钮 返回 主 对 话 框 , 单 击 ”ORKR2" 按 锂 


4 Descriptives 


Stafistie tr 


he et! :8623 
Lower Bournd 28, B81O 

Lpper Bound 32, 1690 

0.2778 

30, SDN 

29, 7380 

er | 

21.00 

45., D0 

24. 00 

?. S000 

i 40 P| 
. DAD .3 


由 表 4-3 可知, 根据 样本 数据 估计 的 总 体 平均 数 的 95% 的 置信 区 间 为 :置信 下 限 
(Lower Bound} 为 28. 681 .置信 上 限 tUpper Bound) 为 32. 169, 即 置信 和 区间 汐 128. 681， 
32. 169}, i 


时 一 二 二 复习 思考 与 练 相 是 二 一 jpop 


1. 解 词 

抽样 分 布 .抽样 误差 ,标准 误 . 统 计量. 参数 ,点 估计 ,区 间 估 计 . 置 信 区 间 ,置信 和 度 

2. 良好 统计 量 需 要 具备 哪些 特征 ? 

3. 从 区 高 中 三 年 级 学 生 中 随机 抽取 了 400 名 学 生 参 加 英语 调试 ,得 到 的 平均 分 为 76 
分 ,标准 差 为 15 分 。 请 你 分 别 用 1 分布 和 ZZ 分布 计算 该 区 高 中 三 年 级 学 生 英语 成 绩 的 
95% 和 99 吕 的 置信 区 间 。 从 这 两 种 分 布 计算 结果 的 比较 中 ,你 得 到 什么 认识 ? 

4. 从 某 省 抽取 了 2000 名 20 一 30 网 年 龄 段 的 人 测试 体重 ,平均 体重 为 65 公斤 , 标 淮 
差 为 8 公斤 。 如 果 要 想 利 用 样本 平均 数 来 估计 总 体 平 均 数 ,使 其 估计 误差 不 超出 土 1 公 
斤 ; 而 且 居 计 的 置信 和 度 达 到 旺 贤 的 水 平 ,那么 样本 窜 量 至 少 要 达到 多 少 ? 

5. 从 参加 某 市 高 一 数学 统考 的 学 生 中 随机 抽取 一 个 班 共 48 人 ,计算 得 到 他 们 的 平 
均 成 绩 为 72 分, 标 淮 差 为 6 淄 , 试 根据 该 班 学 生 的 成 绩 居 计 全 市 高 一 学 生 的 数 党 平 
均 分 ， 

6. 从 一 总 体 随 机 抽取 一 25 人 的 样本 ,其 心理 健康 水 平平 均 数 为 40 分 .标准 差 为 10。 
试 计算 其 总 体 平均 数 的 旺 名 和 归 中 的 置信 区 间 , 并 说 明 这 里 的 署 信 区 间 和 置信 度 的 
意义 。 

7. 随机 抽取 了 120 名 考生 的 高 考 英 语 成 绩 , 其 分 布 情况 如 表 4-4 所 示 。 试 根据 这 
120 名 考生 的 高 考 英 语 成 绩 ,估计 全 体 考 生 英 语 成 绩 的 5 沁 置 信和 区 间 。 

表 4-4 考生 样本 的 英语 成 绩 分 布 表 


分 组 区 间 次 数 向 此 守 次 数 向 下 黑 计 次 数 


四 — 1 lat ] 
80 一 9 ig 10 
70 一 35 110 45 
60 62 75 107 
50- 10 13 117 
40 一 3 3 120 
>) 120 


如 果 采 用 SPSS 系统 ,如 何 完成 此 题 冒 信 区 间 的 估计 呢 ? 

8. 有 人 根据 部 分 考生 的 某 一 门 高 考 课程 的 成 绩 来 估计 全 体 考生 该 课程 的 平均 成 绩 ， 
已 知 全 体 考生 成 绩 的 标准 差 为 50 分。 在 95 吧 的 置信 和 度 下 ,要 使 估计 区 间 不 超过 10 分 ， 
至 少 需 要 多 大 的 样本 ? 

9. 某 心理 学 家 对 某 市 小 学 三 年 级 学 生 进 行 了 一 次 团体 智力 测验 。 从 中 抽取 38 名 学 


于 中 鹤 革 ”以 回 游 


1 


生 的 智商 如 下 所 示 。 请 用 SPSS 程序 计算 总 体 平均 智商 的 归 希 是 信 区 间 。 
lp3 115 101 110 125 112 111 114 110 1067 105 104 112 
1 114 120 101 109 110 112 107 106 1l0 102 111 119 
117 115 113 111 109 105 103 113 110 118 115 111 
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第 五 章 “平均 数 的 差异 性 ! 检验 
Ga 


单 样 示 平均 教 的 显著 性 检验 ,主要 考察 单个 样本 的 平均 数 与 特定 总 体 平 均 数 间 征 香 
具有 显著 差异 ;两 个 样 示 平均 才 差异 的 显著 性 检验 ,主要 是 通过 样本 平均 数 之 间 的 冀 表 
来 推断 西 沾 样 未 所 伐 表 的 总 体 是 否 存在 显著 性 差异 ,此 部 分 讨论 中 将 样本 分 为 独立 样本 
和 相关 料 末 两 美 。 在 上 述 所 有 的 假设 痊 验 过 程 中 ,都 雪 要 根据 不 同 的 具体 条 件 , 选 择 不 
同 的 检验 统计 量 , 有 时 是 "Z 检验 ”", 有 时 是 "t 检验 ”"。 组 间 设 计 和 组 肉 设计 是 实验 心理 学 
中 两 种 最 基本 的 实验 设计 方法 ,从 中 蔬 取 的 研究 资料 几乎 都 可 以 使 用 ! 检验 进行 兰 开 
分 析 。 


前 一 章 讨论 的 是 用 样本 统计 量 司 计 总 体 参 数 。 心 理学 等 行为 科学 的 研究 中 ,还 常常 
需要 对 两 个 或 更 多 个 总 体 参 数 之 间 的 差异 性 进行 分 析 , 对 总 体 分 布 形态 及 其 他 特征 进行 
考察 等 ,这 就 要 用 到 统计 推断 的 另外 一 个 方面 一 一 假设 检验 。 假 设 检验 的 基本 任务 就 大 
利用 样本 数据 及 其 相互 美 系 ,检验 美 于 总 体 参 数 或 总 体 分 布 形态 的 某 些 假设 是 否 合 理 ， 
确定 假设 的 可 接受 程度 。 


第 一 节 ”假设 检验 的 基本 原理 


一 、 假 设 与 假设 检验 


(一 ) 假设 

科学 研究 经 常会 用 到 假设 。 所 谓 假 设 . 就 是 根据 已 知 理论 或 事实 对 研究 对 象 作出 的 
假定 性 说 明 。 那 么 ,对 于 心理 学 研究 来 说 , 常 需 要 作出 什么 样 的 假设 呢 ? 

比如 在 心理 学 实验 室 中 ,可 以 将 来 自 同 一 个 班级 的 20 名 太 学 生 随 机 分 成 两 个 组 ; 
-组 被 试 在 接受 到 声音 刺激 时 作出 快速 反应 ,测量 到 声音 刺激 的 简单 反应 时 间 ; 男 一 个 


车 博 财 沁 


组 在 接受 到 灯光 刺激 时 作出 快速 反应 ,测量 到 灯光 刺激 的 简单 反应 时 间 。 结 果 , 灯 光 刺 
激 的 反应 时 间 比 声音 刺激 的 反应 时 间 多 30ms。 这 样 ,研究 者 就 面临 一 个 问题 ;这 30ms 
的 差异 是 什么 因素 带 来 的 呢 ? 是 分 组 不 平衡 导致 两 个 组 被 试 本 身 存 在 差异 造成 的 吗 ? 
是 测 秋 中 的 许多 偶然 因素 造成 了 数据 的 随机 波动 ? 比如 硕 巧 使 得 灯光 刺激 组 的 数据 向 
上 波动 .声音 刺激 的 数据 向 下 波动 。 是 声音 刺激 与 灯光 刺激 引起 的 神经 系统 运动 机 制 


“0 


一 0 性 字 夫 网: 





与 速度 不 同 造成 的 吗 ? 显然 ,最 后 一 点 是 具有 普遍 意义 的 因素 ,如 果 访 原因 成 立 , 就 意 
味 着 声 刺 激 条 件 下 的 实验 被 试 组 与 光 刺 激 条 件 下 的 实验 被 试 组 各 自 代 表 的 总 体 也 存在 
差异 性 。 

由 此 看 出 ,研究 者 在 不 同 条 件 下 观测 得 到 不 同 的 数据 样本 后 ,必须 对 样本 数据 的 差 
异 来 源 作出 判断 ,该 差异 是 否 意味 着 他 们 各 自 所 在 的 总 体 存在 差异 。 统 计 学 的 术语 为 ， 
样本 统计 量 存在 差异 ,能 香 推断 出 总 体 参 数 存在 差异 ! 统计 推断 要 做 的 第 二 件 事 就 是 诸 
如 此 类 的 假设 检验 。 

假设 检验 ,顾名思义 ,必须 先 有 了 假设。 统计 学 中 的 假设 一 般 是 指 ,用 统计 学 术语 对 总 
体 参 数 或 总 体 分 布 形态 及 其 他 特征 所 作 的 假定 性 说 明 。 先 从 相互 对 立 的 两 个 方面 给 出 
假设 性 说 明 , 即 所 谓 的 * 研 究 假 设 "CH) 和 “虚无 假设 "tH,) ;然后 ,根据 样本 资料 的 统计 
分 析 结 果 , 对 两 个 假设 作出 选择 ,其 中 :拒绝 虚无 假设 而 接受 研究 假设 ,意味 着 研究 假设 
被 证 实 ;接受 虚无 假设 而 拒绝 研究 假设 ,意味 着 研究 假设 未 被 证 实 ， 

1 . 虚无 介 设 

虚无 假设 又 称 无 差 假 设 . 零 假设 ,顾名思义 ,就 是 类 似 于 “总体 参数 之 间 没 有 显著 差 
异 "或 总体 分 布 形态 符合 正 态 分 布 " 这 样 的 假设 。 假 设 检验 的 过 程 往往 是 以 “虚无 假设 
成 立 "为 前 提 而 展开 ,主要 考察 ;虚无 候 设 成 立 的 情况 下 ,样本 数据 出 现 我 们 所 看 到 的 情 
形 的 概率 即 伴随 概率 有 和 多大。 伴随 概 率 越 小 ,说 明 虚 无 假设 成 立 的 合理 性 越 小 , 越 有 理 
由 拒绝 虚无 假设 :伴随 娩 率 越 大 ,说 明 虚 无 假设 成 立 的 合理 性 越 大 ,拒绝 虚无 假设 的 理由 
也 就 越 不 充分 ， 厅 , 是 统计 推论 的 出 发 点 ,因为 它 所 做 出 的 假定 性 说 明 可 以 为 人 们 提供 
进一步 检验 推导 的 必需 理论 基础 ， 这 里 ,引用 著名 统计 学 家 费 舍 的 一 句 名 言说 明 虚 无 候 
设 的 作用 ,“ 每 一 实验 的 存在 ,仅仅 是 为 了 给 事实 一 个 反 驶 虚无 假设 的 机 会 ,” 

2. 研 痪 假设 

研究 假设 ,又 称 对 立 假 设 或 备 择 假设 ， 它 与 虚无 假设 相对 立 , 一 般 总 是 作 * 兽 体 参数 
之 间 有 显著 差异 ?或 "总 体 分 布 形态 不 符 台 正 态 分 布 * 等 假设 。 在 假设 检验 中 ,如 果 帮 充 
分 的 理由 证 明 虚 无 假设 (FT ) 不 成 立 , 那 么 就 可 接受 研究 假设 CH, )。 反 之 , 若 无 充 分 理由 
证 明 虚 无 假设 CH, ) 错 误 , 即 不 能 否定 , ,那么 就 不 能 接受 研究 假设 H,。 在 统计 学 中 ， 
H, 和 H, 相互 排斥 ,最 后 只 能 接受 一 个 ， 


(二 ) 假设 检验 

如 果 用 一 句 话 来 解释 假设 检验 的 基本 原理 ， 那 就 是 , “假设 检验 和 于 1 
质 的 上 友 证 法 ,” 其 具体 过 程 是 ， 首先 建立 虚无 假设 ， 并 假定 其 为 丰 ， 接着 在 典 无 假设 的 
前 提 之 下 进行 统计 推 性 。 如 果 出 现 违反 馆 辑 或 违背 人 人 们 常识 和 经 验 的 不 合理 现象 ， 刘 
表明 “虚无 假设 为 真 ”的 不 合理 性 ， 即 不 能 接受 虚无 假设 ， 从 而 接受 其 对 立 面 一 - 研 
究 假 设 。 如 果 没 有 出 再不 合理 现象 ， 那么 ， 就 可 以 认为 “虚无 假设 为 真 ”的 前 提 是 合 
理 的 ， 就 可 以 接受 虚无 假设 。 

日 带 生 活 中 ,人 们 经 常会 运用 “假设 检验 "的 方法 来 对 事物 做 出 判断 与 推理 。 例 如 ， 
某 产 品质 量 检查 小 组 欲 对 某 工厂 的 产品 质量 进行 检查 .按照 行业 规定 ,该 厂 产品 的 各 格 
率 应 达到 99 如 。 也 就 是 说 ,在 100 年 记 吉 中 : 应 该 有 99 件 是 合格 产品 ,只 有 工件 是 次 品 。 
但 是 工作 人 员 随 机 抽取 了 10 件 产品 检查 后 发 现 ,这 10 件 产品 中 有 5 件 是 采 台 格 的 。 于 





是 ,检查 小 组 得 出 来 该 厂 产品 质量 不 符合 行业 规定 的 结论 。 在 上 述 例 子 中 ,检查 小 组 工 
作 人 员 要 检验 的 假设 是 “该 厂 产品 达到 了 行业 规定 的 要 求 ", 换 一 种 说 法 是 "每 100 件 产 
品 中 这 品 不 超过 1 件 ”- 在 这 个 前 提 下 ,任意 抽取 的 10 件 产 品 中 支 欧 只 有 上 工件 珍品 ,也 
就 是 说 ,基本 上 应 该 设 有 次 品 。 然 面 ,现在 的 事实 是 :在 一 次 实际 的 抽样 调查 中 ,竟然 发 
生 了 5 件 产品 不 合格 的 情况 。 如 果 上 述 前 提 假 设 成 立 , 那 么 这 种 现象 是 不 合理 的 ,因此 
我 们 有 理由 怀疑 该 前 提 假 设 的 正确 性 ,从 而 做 出 “该 厂 产 品质 量 不 符合 行业 规定 要 求 "的 
铺 论 。 

显然 ,在 上 述 推论 过 程 中 用 到 了 反 证 法 思想 :假定 虚无 假设 是 成 立 的 ,在 此 前 提 下 ， 
基 一 现象 发生 的 可 能 性 应 该 很 小 ;但 是 如 果 这 个 不 太 可 能 发 生 的 现象 实际 上 却 贫 生 了 ， 
即 出 现 了 不 台 理 的 结果 , 则 表明 原先 的 假定 是 难以 成 立 的 -。 


(三 ) 小 概率 原理 

上 述 推理 中 ,我 们 实际 上 还 用 到 了 * 小 概率 事件 在 一 次 试验 中 实际 不 会 发 生 "的 思 
想 , 即 小 概率 原理 ,也 称 * 实 际 推断 原理 ”。 所 谓 小 概率 事件 ,是 指 发 生 概 率 很 小 的 事件 。 
例如 , 买 一 张 彩票 就 中 大 奖 ,这样 的 事件 就 是 小 概率 事件 。 因为 我 们 认为 在 实际 上 不 会 
发 生 ,或 至 少 可 以 说 ;不 大 可 能 发 生 。 同 理 ,在 上 例假 设 成 立 的 前 提 下 ,抽取 10 件 产品 有 
5 件 次 品 的 情况 应 该 是 一 个 小 概率 事件 。 我 们 同样 也 认为 它 实际 上 不 会 发 生 , 但 却 发 生 
F ,与 假设 产生 了 * 显 著 性 "的 矛盾 ,从 而 香 定 了 前 提 假 设 。 不 过 ,这 种 对 前 提 假 设 的 和 否定 
存在 犯错 误 的 可 能 性 ,因为 小 概率 事件 虽然 发 生 的 概率 很 小 ,但 毕竟 不 是 零 。 因此 ,该 假 
设 检 验方 法 有 一 个 显著 的 特点 :+ 即 它 不 是 * 百 分 百 的 反 证 法 ”, 而 是 “ 带 有 概率 性 质 的 尽 证 
法 ”, 是 有 可 能 犯错 误 的 ;只 是 这 种 错误 被 规定 在 一 个 小 概率 范围 之 内 。 统计 学 上 的 "小 
概率 ”一 般 有 这 训 几 种 取 值 :0.05,0.01,0. 001。 研究 者 可 根据 需要 选用 合适 的 小 概率 界 
限 。 若 取 0.05, 则 表示 凡 发 生 概率 小 于 0.05 的 即 为 小 概率 事件 ;者 取 0.01， 则 表示 凡 发 
生 概 率 小 于 0.01 的 即 为 小 概率 事件 ; 依 此 类 推 

【 例 5-1] 某 市 进行 数学 统考 ,成绩 服 从 正 态 分 布 。 全 市 平均 分 占 一 55, 标 准 差 m 
二 10, 随 机 抽取 该 市 某 校 的 一 个 班 (n= 二 49) ,其 平均 成 绩 和 =58, 间 该 班 成 绩 与 全 市 平均 
成 绩 的 差异 是 吾 显 著 ? 

【 解 】 该 班 平均 成 绩 58 分 ,高 于 全 市 平均 分 ;这 并 不 能 说 明 该 班 的 真实 水 平 比 全 市 
平均 水 平 高 。 国 为 假如 再 进行 等 值 试卷 的 考试 ， 也 许 访 班 的 平均 成 绩 又 比 全 市 的 平均 分 
低 了 。 所 以 从 理论 上 讲 , 一 个 班 数 竺 :成 绩 的 直 实 水 平 应 该 是 进行 无 数 次 等 值 试 着 的 考试 
后 ,无 数 次 平均 成 绩 的 总 平均 分 (用 ps 表示 )。 在 这 里 jy 与 ys 相 比 ， 究竟 谁 高 谁 低 , 亦 或 
相等 ,需要 运用 假设 检验 方法 来 确定 。 

首先 ;建立 虚无 假设 Ho :pp 二 各。 

显然 ,研究 假设 为 囊 :ps 攻 pp。 

根据 虚无 假设 ,该 班 真 实 水 平 与 全 市 平均 成 绩 设 有 差异 。58 分 与 55 分 之 差 是 由 于 
抽样 误差 或 测量 的 随机 误差 造成 的 。 在 此 前 提 下 ,由 抽样 分 布 理论 可 知 ,总 体 正 意 分 布 ， 
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如 图 5-1 所 示 。 

从 方差 已 知 的 正太 分 布 总 体 中 随机 抽取 一 个 
样本 ,其 样本 平均 数 站 的 抽样 分 布 服从 正 态 分 
布 ,样本 平均 数 祥 对 应 的 标准 分 数 介 于 一 1. 96 
与 1] .8 之 间 的 概率 是 9 最。 这 意味 着 :X 对 应 
的 标准 分 数 处 在 小 于 一 1.9%6 和 大 于 1. 36 的 两 
个 尾部 的 概率 总 和 只 有 5 中 , 即 图 5-1 中 两 个 阴 
影 部 分 的 面积 和 只 占 正 态 分 布 曲 线 下 面积 的 
5W。Z. 二 2.10 大 于 1.96, 显 然 ,其 发 生 的 概率 肯定 是 小 于 5% 的 ,是 个 小 概率 事件 ,“ 是 
不 大 可 能 发 生 的 事件 ”。 如 果 它 还 是 发 生 了 ,我 们 就 有 了 充分 的 理由 认为 “虚无 假设 "是 
不 大 可 能 成 立 的 ,因此 否定 HH 而 接受 有 Hi,, 认 为 58 分 与 55 分 的 差别 不 只 是 抽样 误差 造 
成 的 , 即 该 班 的 真实 水 平 yp 与 全 市 平均 成 绩 之 间 确 实 存 在 显著 差异 。 

在 上 例 分 析 中 ,我们 实际 还 使 用 了 两 个 概念 :显著 性 水 平 .否定 域 。 所 谓 显著 性 水 
平 ,就 是 指 研究 者 所 确定 的 小 概率 的 最 夫 限 。 比 如 上 例 中 ,认为 小 于 或 者 等 于 0.05 的 概 
率 是 小 概率 ,其 上 限 为 0.05, 则 称 0.05 为 显著 性 水 平 。 显 著 性 水 平 通 常用 = 表示 ,根据 
研究 需要 不 同 ,显著 性 水 平 也 即 小 概率 界限 可 以 改变 ,经 常 使 用 的 有 0.05.0.01.0. 001 
三 种 ,可 写作 :ae 一 各 05,a=0.0la= 一 0 001。 一 般 我 们 把 小 于 0.05 的 显著 性 水 平 称 为 " 显 
著 ", 小 于 0.01 的 显著 性 水 平 称 为 “非常 显著 " .小 于 0. 001 的 显著 性 水 平 称 为 "极其 显 
著 "。 所 谓 香 定 域 , 是 指 在 假设 检验 中 ,根据 已, 建立 的 概率 分 布 模型 ,根据 显著 性 水 平 a 
结合 这 些 概 率 分 布 模型 确定 数 轴 上 的 某 个 ( 些 ) 区 间 ,检验 统计 量 在 其 中 出 现 的 概率 小 于 
或 等 于 a, 则 称 这 个 ( 些 ) 区 间 为 香 定 域 。 上 例 中 ,否定 域 为 Z 一 1, 96 或 Z 一 一 1,96。 我 们 
把 否定 域 的 界限 称 为 临界 值 。 显然, 这 里 的 临界 值 为 土 1. 96, 临 界 值 的 太 小 随 显著 性 水 
平 的 大小 而 变 , 若 上 例 中 取 ma 一 0.01, 则 临界 值 变 为 士 2.58。 


二 、 单 侧 检验 与 双 侧 检验 


在 例 5- 1 中 ,否定 域 设置 在 抽样 分 布 曲 线 数 轴 的 两 个 尾部 ,这 种 假设 检验 称 为 双 侧 
检验 。 此 时 ,虚无 假设 为 用 ,so 一 各 + 研究 假设 为 Hi sp 闫 po: 究竟 哪 种 假设 成 立 ? 如 果 
后 天 po 那么 一 定 是 jp 庆 pn 或 jp 二 ph。 可 是 .为 什么 研究 假设 不 直接 用 ji 三 上 和 js 二 
iu 中 的 一 个 呢 ? 这 是 由 于 我 们 在 做 检验 之 前 没有 任何 信息 能 预示 js 与 js 之 间 有 可 能 
是 什 笃 美 系 。 所 以 ,在 设置 否定 域 时 ,抽样 分 布 曲线 数 轴 去 、 右 两 端 都 有 否定 域 的 一 半 ， 
检验 统计 量 不 论 落 人 哪 一 半 理 定 域 , 都 可 否定 甩 ,, 因 此 ,这 样 的 检验 称 为 双 侧 检验 ,但 
是 ,在 本 例 中 ,如 果 这 个 49 名 学 生 的 班级 是 重点 实验 班 ,我 们 有 充分 的 理由 相信 ,这 个 班 
真实 水 平 有 可 能 高 于 全 市 平均 水 平 ,那么 我 们 就 需要 检验 X=58 分 与 ps 二 55 分 的 差别 
是 抽样 造成 的 偶然 误差 ,还 是 因为 其 真实 水 平 确实 商 于 全 市 平均 水 平 。 这 样 一 来 ,虚无 
假设 Hs :jp ==po ,研究 假设 机, 则 改 为 :um 二 pw。 这 时 ,我 们 考察 样本 平均 数 出 现 的 小 概 
率 区 域 仅 在 抽样 分 布 曲线 数 轴 的 右 侧 尾部 端 , 如 图 5-2a 所 示 ， 

令 a 二 0.05;, 则 对 应 的 Z 的 临界 值 为 1, 65, 即 Zu 一 1.65。 例 子 5- 工 中 由 于 2 一 








图 5=1 晰 计算 之 值 在 正 访 分布 中 的 性 牌 





图 5-2 单 侧 检验 示意 图 
2. 10 二 Zum , 落 在 了 否定 域 , 可 以 在 0. 05 显著 性 水 平 上 和 否定 有 H, 而 接受 及 ,这 种 检验 方 
法 称 为 右边 单 侧 检验 。 左 边 单 侧 检 验 与 此 类 似 , 如 图 5-2b 所 示 , 不 过 HH 应 为 ps 一 po。 
三 、 统 计 决 策 的 两 类 错误 
前 文 已 经 指出 ,所 有 的 假设 检验 都 是 带 有 概率 性 质 的 反 证 法 ,都 存在 犯错 误 的 风险 。 
在 统计 决策 中 ,有 两 种 类 型 的 错误 ,如 表 5 - 1 所 示 。 
表 5-1 统计 决策 的 两 类 错误 














接受 虚无 假设 HH， 


正确 概率 1 一 a 
取 伪 概率 (第 二 类 错误 ) 


拒绝 虚无 假设 甩 , 
弃 真 概率 a( 第 一 类 错误 ) 
正确 概率 1 一 8 


第 一 类 错误 :否定 了 虚无 假设 H, ,但 它 实 际 上 是 真实 的 。 此 类 错误 又 称 a 错误 , 概 
率 为 a。 

第 二 类 错误 :接受 了 虚无 假设 妃 , ,但 它 实 际 上 是 不 真实 的 。 此 类 错误 又 称 8 错误 ， 
概率 为 8。 fo 分 布 用 分 布 

我 们 将 两 类 错误 反映 在 图 5-3 上 ,就 容易 看 
得 出 来 它们 是 如 何 发 生 的 ,以 及 它们 的 关系 。 

如 图 5-3 所 示 , 当 拒绝 虚无 假设 的 时 候 , 就 
是 拒绝 承认 天 是 来 自 于 玉 , 假 设 的 总 体 中 的 一 个 
样本 。 而 实际 上 这 一 分 布 中 的 样本 平均 数 还 有 a 
的 概率 处 在 处 及 其 右边 区 域 ,所 以 拒绝 了 X, 也 就 图 5-3 两 类 错误 及 其 关系 示意 图 
同时 拒绝 了 其 以 外 的 样本 ,其 弃 真 概率 就 是 图 5 -3 中 的 面积 a。 

相反 , 当 接 受 碰 无 假设 的 时 候 , 就 是 承认 平均 数 为 X 的 样本 及 其 左 侧 的 部 分 样本 属 
于 ,假设 中 的 总 体 , 同 时 拒绝 承认 它们 属于 H, 假设 的 总 体 。 而 实际 上 ,在 这 一 范围 内 
仍然 有 部 分 样本 可 能 是 来 自 于 万, 分 布 的 ,其 概率 就 是 图 5 -3 中 的 面积 8。 可 是 因为 接 
受 了 虚无 假设 ,这 一 部 分 可 能 是 属于 HH) 的 样本 被 否决 了 ,所 以 这 种 错误 叫做 取 伪 错误 ， 
其 概率 为 B。 






H。 实际 上 为 真 
Ho 实际 上 为 假 
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在 统计 决策 中 ,如 果 依 据 概 率 性 质 的 反 证 法 否定 了 万 , ,就 可 能 会 犯 第 一 类 错误 。 不 
过 ,这 一 类 错误 的 概率 可 以 控制 ,只 要 提高 规定 的 显著 性 水 平 ,就 可 以 达到 降低 犯 w 类 
错误 的 概率 。 但 要 注意 的 是 ,降低 a 类 错误 的 同时 ,使 得 否定 ,更 加 困难 ,从 而 增加 也 
类 错误 的 概率 。 

需要 指出 .a 错误 与 错误 分 别 是 在 两 种 不 同 前 提 下 发 生 的 ,也 是 在 两 个 不 同 分 布 中 
进行 分 析 的 ,所 以 a 十 Bl1。a 错误 是 可 以 控制 的 ,可 以 通过 改变 显著 性 水 平 来 改变 = 错 
误 的 概率 ,而 8 错误 则 是 难以 控制 和 考察 的 。 在 任何 = 水 平 上 ,即使 我 们 不 能 拒绝 虚无 候 
设 , 也 不 能 草率 地 承认 虚无 假设 ,否则 犯错 误 的 概率 就 很 大 。 我 们 可 以 做 出 诸如 "根据 
目前 资料 ,在 “水平 上 未 发 现 显著 差异 "一 类 的 结论 。 可 能 情况 下 , 增 大 样本 容量 可 以 减 
小 = 错误 与 有 错误 的 概率 ， 


、 参 数 检验 与 非 参 数 检验 


假设 检验 包括 参数 检验 和 非 参数 检验 。 如 果 进 行 假设 检验 时 总 体 的 分 布 形态 已 知 ， 
需要 对 总 体 的 未 知 参 数 进 行 假设 检验 , 则 称 为 参数 假设 检验 ;如 果 对 总 体 分 布 形态 所 知 
盐 少 ,需要 对 未 知 分布 出 现 的 形态 及 其 他 特征 进行 假设 检验 , 则 称 为 非 参数 假设 检验 。 

本 书 中 介绍 的 上 检验 .方差 分 析 . 相 关系 数 的 检验 .比率 的 检验 等 都 属于 参数 检验 的 
范畴 ,而 x: 检验 . 秩 和 检验 .符号 等 级 检验 .等 级 方差 分 析 则 属于 非 参 数 检验 的 范畴 ， 


五 、 假 设 检验 的 步骤 


综 上 所 述 , 可 以 归纳 出 假设 检验 的 一 般 步骤 : 

步骤 1; 提 出 假设 。 根据 研究 的 间 题 ,提出 相应 的 研究 假设 万 和 虚无 假设 Hs， 选择 
使 用 双 侧 检验 还 是 单 侧 检验 . 

步骤 2; 根据 虚无 假设 如 ,所 提供 的 前 担 条 件 ,选择 台 适 的 检验 统计 量 , 如 Z.1 等 。 

步骤 3: 规定 显著 性 水 平 a。a 确定 后 ,否定 域 也 随 之 被 确定 了 ， 

步骤 4 计算 检验 统计 量 的 值 ， 

步 双 5: 做 出 决策 。 根据 显著 性 水 平 a 和 检验 统计 量 的 分 布 , 查 相应 的 统计 表 , 确 定 
接受 域 和 否定 域 的 临界 值 , 用 计算 出 的 统计 量 值 与 临界 值 作 比 较 , 从 而 做 出 接受 或 拒绝 
虚无 假设 的 决策 ， 


第 二 节 单 样本 平均 数 的 差异 检验 


单 样 本 平均 数 的 显著 性 检验 ,是 指 对 单个 样本 的 平均 数 与 特定 总 体 平均 数 间 的 差异 
进行 显著 性 检验 。 如 果 检 验 结果 差异 显著 , 则 表示 样本 平均 数 的 总 平均 ( 即 pp ) 与 总 体 平 
均 数 ( 即 uw，) 有 差异 ,或 者 说 样本 平均 数 下 与 总 体 平均 数 jy, 之 间 的 差异 已 不 能 用 抽样 保 
差 来 解释 了 ,可 以 被 认为 是 来 自 另 一 个 总 体 ， 此 时 , 称 这 个 样本 平均 数 X“ 显 著 "。 根 
据 总 体 分 布 的 形态 及 总 体 方差 是 和 否 已 知 ,其 具体 的 检验 过 程 有 所 不 同 ， 


一 、 总 体 为 正 态 分 布 且 方差 已 知 
当 总 体 为 正 态 分 布 且 方 差 已 知 时 ,样本 平均 数 的 抽样 分 布 为 正 态 分 布 ,因此 选择 Z 


一 一 
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分 数 作为 检验 统计 量 ;: 再 根据 所 要 求 的 显著 性 术 平 a; 从 正 访 分 布 表 中 查 出 临界 点 的 三 值 
加 以 比较 ,这 样 的 检验 由 于 选用 了 2Z 分数 必 为 检验 统计 量 , 因 此 叉 称 为 Z 检验 。 例 5-1 
运用 的 是 单 样本 平均 数 显著 性 检验 ,使 用 了 检验 ,上 且 为 双 侧 检验 。 例 5- 二 运用 年 例 
检验 ， 

【 例 5-2] 某 心理 学 家 从 受过 某 项 专门 训练 的 儿童 中 随机 抽取 64 人 进行 书 克 斯 勒 
儿童 智力 测验 (二 100,6, 二 15)。 结 果 发 现 ,这 64 名 儿童 的 平均 智商 为 105， 问 :能 香 
认为 这 些 接受 了 该 项 训练 的 儿童 的 智力 高 于 其 所 在 年 龄 组 儿童 的 智力 的 一 般 水 平 ? 

【 解 】 根据 题 意 ,该 问题 属于 单 样 本 平均 数 的 显著 性 检验 。 因 为 总 体 为 正 态 分 布 且 
方差 已 知 , 所 以 可 以 使 用 ZZ 检验 。 又 因为 本 间 题 是 要 检验 样本 平均 数 是 否 " 高 于 "所 在 总 
体 , 可 用 单 侧 检 验 。 

(1) 建立 研究 假设 和 虚无 假设 

Hosp, = po Hi 1p, > po 

‘2) 计算 检验 统计 量 

根据 题 意 ,X 的 抽样 分 布 为 正 态 分 布 , 其 标准 误 : 








OE I 
Tn 6d 
式 一 0 b= 
= 
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(3) 令 ga 一 0,01, 查 正 态 分 布 表 , 单 侧 检 验 的 a=0.01, 临 界 点 Zo 二 ,33, 所 以 本 
题 中 计算 的 检验 统计 量 Z=2, 67 守 2Z,_oo :于 是 可 以 在 a 二 0.,01 显著 性 水 平 上 拒绝 虚无 
假设 而 接受 研究 假设 , 即 gp; 广 p ;可 以 认为 受训 儿童 的 智力 水 平 里 高 一 些 。 


二 、 总 体 为 正 态 分 布 但 方差 未 知 


当 总 体 为 正 态 分 布 ,但 总 体 方差 未 知 时 ,样本 平均 数 的 抽样 分 布 为 分布, 因此 选 返 
i 分 数 作为 检验 统计 量 , 再 根据 所 要 求 的 显著 性 水 平 a 和 自由 度 dr 一 ?一 1, 从 上 分 布 表 中 
查 出 临界 值 加 以 比较 。 这 样 的 检验 由 于 选用 了 1 分数 作为 检验 统计 量 , 因 此 又 称 为 + 检 
验 。 需 要 指出 的 是 ,尽管 当 样 本 容量 较 大 时 ,X 的 抽样 分 布 接近 正 态 ,此 时 也 可 选用 分 
数 作为 检验 统计 量 而 进行 近似 的 Z 检验 ,但 严格 说 来 ,还 是 使 用 1 检验 更 精确 ,使 用 ZzZ 检 
验 主要 是 为 了 计算 的 简便 。 实 际 应 用 中 ,检验 过 程 一 般 都 使 用 SPSS 等 统计 软件 完成 ,t 
检验 过 程 已 不 构成 计算 负担 ,所 以 都 使 用 上 检验 。 

【 例 5-3] 一 般 来 说 ,人 的 视觉 反应 时 符 台 正 态 分 布 。 某 心理 学 家 研究 发 现 , 首 通 
飞行 员 的 平均 视觉 反应 时 为 170 毫秒 。 某 人 随机 抽取 25 名 飞行 员 进 行 测定 ,结果 发 现 
其 平均 视 反应 时 为 175 上 毫 种 ,标准 差 为 15 毫秒 。 问 :能 否 根据 该 省 试 结果 香 定 该 心理 学 
家 的 结论 ? 

[ 解 ] 根据 题 意 已 知 : = 二 170, 玉 二 175,S 一 15,n 二 中 。 但 是 总 体 方 差 未 知 , 所 以 样 
本 平均 数 符合 1 分布, 使 用 1 检验 ， 

研究 假设 Hi :ps 天 pn 








二 关 昧 区 一 入 要 有 层次 昔 蒜 ” 骨 钱 避 





检验 统计 量 的 自由 度 :d4 一 "一 1 一 24 

查 附 表 3 的， 值 表 ( 双 侧 )iaiis 二 2.064。 而 4 一 1.67 二 2.064, 在 0.05 显著 性 水 平 上 
不 能 拒绝 虚无 假设 ,所 以 拒绝 研究 假设 , 即 样本 平均 数 与 总 体 平均 数 的 差异 不 显著 。 根 
据 样 本 测试 资料 ,不 能 否定 该 心理 学 家 的 研究 结论 ， 


三 、 总 体 为 非 正 态 分 布 


如 打 有 证 据 表 明 某 一 变量 测量 值 的 总 体 不 是 正 态 分 布 , 那 么 其 平均 数 的 抽样 分 布 既 

不 符合 正 态 分 布 , 也 不 符 人 台 上 分 布 ,原则 上 不 能 进行 Z 检验 或 1 检验 ,应 该 使 用 非 参 数 检 
验 。 但 当 样 本 容量 较 大 时 ,根据 中 心 极限 定理 ,对 的 抽样 分 布 趋 近 正 态 , 且 j= jp "ay = 
六 所 以 , 当 w 宇 30( 也 有 人 人 认为 sn 主 50) 时 ,尽管 总 体 分 布 非 正 态 ,但 对 平均 数 的 显著 性 
于 

检验 仍 可 用 Zz 检验 。 用 于 此 时 的 ZZ 检验 是 近似 的 , 故 称 Z 检验 。 检验 统计 量 的 计算 公式 
为 Z 一 从, 若 m 未 知 ,出 于 样本 容量 较 大 ,可 直接 用 样本 标准 差 S 代 荐 公式 中 的 

可 六 yn 


| 
(公式 5 一 1) 


【 例 5-4】 已 知 某 市 某 次 数学 统考 的 成 绩 呈 偏 态 分 布 ,总 平均 分 为 68.5 分 。 其 中 
某 校 参加 考试 的 学 生 共 121 人 ,平均 分 为 ?1.5 分 ,标准 差 为 18, 问 该 校 平均 分 与 全 市 总 
平均 分 有 无 显著 差异 ? 

L 解 】 此 题 总 体 为 非 正 态 分 布 ,但 一 121 为 大 样本 ,可 以 采用 Z' 检 验 ， 

根据 题 意 已 知 : 生 一 68.5, 基 一 71.5,S 一 18,7 王 12] 

建立 研究 假设 Hi tp 基 p。 

建立 虚无 假设 H， sw = po 


计算 检验 统计 量 ;2 二 此 二? 





使 用 双 侧 检验 , 当 a=0.05 时 ,Z=1,96 
因为 了 一 1.83 一 1.96, 所 以 在 0.05 显著 性 水 平 上 ,不 能 拒绝 虚无 假设 ,可 以 认为 ;该 
校 学 生 的 平均 分 与 全 市 学 生 的 总 平均 分 没有 显著 差异 


一 一 一 一 一 一 一 者 兴 业 归 旭 mn 0 iT 导 时 山 


第 三 节 ”独立 样本 平均 数 的 差异 检验 


两 个 平均 数 差异 的 显著 性 检验 ,就 是 措 由 样本 平均 数 之 间 的 差异 ( 蔗 , 一 总 ) 来 推断 
两 个 样本 各 自 所 代表 的 总 体 之 间 是 否 存 在 显著 差异 (om 一)。 这 时 需要 考虑 的 条 件 更 
为 复 荣 ,和 不仅 要 考虑 总 体 分 布 与 总 体 方差 是 理 已 知 ,还 要 注意 各 总 体 方差 是 否 一 致 .样本 
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之 间 基 相 瑟 独立 的 还 是 具有 相关 性 的 等 .不同 条 件 下 ,使 用 的 公式 也 不 同 。 本 节 专 门 讨 
论 独 立 样本 平均 数 差异 的 显著 性 检验 ， 
所 谓 独立 样本 ,是 指 两 个 样本 的 数据 之 间 不 存在 关联 性 。 就 是 说 ,观测 或 抽取 得 到 


两 个 样 杯 中 的 任何 一 个 数据 时 ,都 不 会 受 到 两 个 样本 中 其 他 数据 的 任何 影响 ,两 者 之 间 
不 存在 连带 关系 ， 两 个 样本 的 容量 可 以 相等 ,也 可 以 不 相等 。 
与 单 样本 平均 数 的 显著 性 检验 一 样 , 不 同 条 件 下 的 检验 计算 有 所 不 同 。 


一 、 两 个 总 体 均 为 正 态 且 方 差 已 知 
可 以 设想 :从 第 一 个 正 态 总 体 (m va ) 中 随机 抽取 容量 为 六 的 样本 ,计算 出 平均 数 ， 
记 为 玉 , ;再 从 第 二 个 正 态 总 体 (m ,加 ?中 随机 抽取 容量 为 忆 的 样本 ,计算 出 平均 数 , 记 为 


吉 . 。 两 个 样本 平均 数 之 间 的 差异 记 为 Dx 一 名 一 和 。 此 时 ,Dx 的 抽样 分 布 为 正 态 分 布 ， 
统计 学 已 经 证 明 其 对 应 的 平均 数 和 标准 差分 别 为 : : 





For Hi Aa 
FF 加 
可 [a F 
二 | 一 十 一 人 一 2) 
Spy | ns (会 并 


将 Di 与 上 一 节 中 的 玉 相 比较 , 则 到 ,一 处 ; 之 间 的 差异 显著 性 检验 可 以 转化 为 对 一 
Da—p, 
个 统计 量 Ds 的 显著 性 检验 ,二 者 在 本 质 上 没有 区 别 , 即 :2 二 一 一 一 。 
Lm 
我 们 知道 ,在 检验 两 个 样本 平均 数 是 否 存 在 差异 显著 性 的 过 程 中 ,要 使 用 的 虚无 假 
设 是 ;两 个 样本 所 在 总 体 的 平均 数 相 等 , 即 各 , ,om 二 ps 或 霹 一 p= 二 0。 于 是 上 述 公 式 就 转 
换 为 : 





区 = (公式 5 一 3) 





Wis 

[ 例 5-5] 某 心 理学 家 从 南方 地 区 的 7 岁 儿 童 中 随机 抽取 了 36 名 男 童 和 34 名 立 
童 ,其 平均 身高 的 数据 分 别 为 ; 男 童 125cm., 友 童 127cem。 以 往 资 料 显 示 , 该 地 区 7 岁 男 童 
身高 的 标准 差 为 5cm, 女 童 身 商 的 标准 莽 为 6cm; 能 知 根 据 这 次 抽样 测量 的 结 此 司 出 “该 
地 区 了 岁 男 女儿 童 身高 有 显著 差异 "的 结论 ? 

【 解 了 已 知 :m 一 36, 双 ,一 1254a0 一 5 一 3 一 127, 一 人 

要 检验 的 假设 帮 :mm 天 

建立 的 虚无 假设 Hs:p 二 j; 

特 上 述 数 据 代 人 公式 5-3 可 得 ， 


Nh YR 4 
当选 择 显著 性 水 平 a 二 0.05 时 ,名 om 一 1.96,|121=1,51 过 名 mor 二 者 的 问 民 性 未 
法 到 0.05 的 显著 性 水 平 , 不 能 拒绝 虚无 假设 。 可 认为 :该 地 区 7 岁 曙 女 儿童 身高 没有 显 
车 差异 。 其 检验 的 错 论 可 记 汶 :2 一 一 1.51, 户 一 0 05， 


二 、 两 个 总 体 均 为 正 态 但 方差 均 未 知 


在 这 种 情况 下 ,样本 平均 数 差 异 量 的 抽样 分 布 符合 ， 分 布 ,所 以 一 般 选 用 : 值 作为 检 
验 统 计量 。 当 然 ,与 单 样本 平均 数 的 显著 性 检验 一 样 ,如 果 样 本 容量 都 足够 大 ( 即 两 个 样 
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本 的 容量 均 大 于 30) ,抽样 分 布 趋 近 于 正 态 分 布 ,可 以 用 Z 检验 。 
而 且 在 这 种 情况 下 ,还 要 注意 两 个 样本 所 在 总 体 的 方差 相等 性 , 即 所 谓 的 方差 齐 性 
是 否 成 立 。 


(一 ) 车 两 总 体 方差 相等 即 一 
此 时 ,Dx 一, 一 部 的 抽样 分 布 为 ， 分 布 ,is 一 和 一 Amveus 一 全 十 坚 。 由 于 上 (或 


Nl 
) 未 知 ,需要 用 Si 和 Si 分 别 作 为 ot 和 号 的 估计 量 。 然 而 ,当中 一 叶 , 究 竟 用 哪 一 个 无 
仿 估 计量 更 好 呢 ? 统计 学 上 一 般 将 两 个 合并 起 来 共同 估计 , 即 计算 二 者 的 联合 方差 


2 _ 191 十 ne S3 \ 
re rp (公式 5 -4) 


用 联合 方差 5; 替换 ou 一 | 于 十 蛙 中 的 qi 和 于 可 得 抽样 分 布 的 标准 误 ， 


《公式 5-5) 


《公式 5 一 6 





df=m 十 7 一 2 (公式 5-7) 

很 明显 ,在 已 知 两 个 样本 所 在 总 体 的 方差 相等 的 情况 下 ,如 果 能 够 计算 出 两 个 样本 
数据 的 平均 数 和 标准 差 ,而 且 已 知 两 个 样本 的 容量 ,就 可 以 使 用 公式 5-6 和 公式 5 一 7 
分 别 计算 两 个 样本 平均 数 差异 显著 性 检验 的 统计 量 : 值 及 其 自由 度 。 

【 例 5 - 6】 从 参加 某 区 数学 统考 的 高 一 学 生 中 随机 抽取 男生 60 人 ,其 平均 成 绩 为 
78 分 ,标准 差 为 6 分 ;女生 56 人 ,其 平均 成 绩 为 75 分 ,标准 差 为 5 分 。 假 设 男 女生 两 总 
体 的 方差 一 致 , 问 男女 生 的 数学 成 绩 有 无 显著 差异 ? 

【 解 】 一 般 学 生 的 课程 考试 成 绩 都 具有 正 态 性 。 再 根据 题 意 知道 两 个 样本 的 方差 
具有 一 致 性 但 方差 的 具体 值 未 知 ,所 以 采用 :检验 . 

已 知 两 个 样本 的 信息 是 :n= 二 60,X! 一 78,S1 三 63n; 二 56,X, 二 75,S; 二 5 

研究 假设 H, :A A 

构建 虚无 假设 Ho, :pm = tg 

将 已 知 数据 代入 公式 5 -6 和 公式 5-7 得到: 

+ nS; 1 加 十 7 
人 
60X6 56X5 /60+56 
TX (00 
df=n,+n;,—2=114 

当选 择 显著 性 水 平 a==0.05 时 ,df 二 114 时 的 上 -ww 一 1.984,t 一 2.89 二 4-ro* 二 者 
的 差异 性 达到 0. 05 的 显著 性 水 平 ,可 以 拒绝 虚无 假设 ,认为 :男女 生 的 数学 成 绩 在 0. 05 
水 平 差异 显著 。 其 检验 的 结论 可 记 为 :t 一 2.89,df 一 114, 户 一 0.05。 





站 二 (及 ， —X; i 


一 (78 一 75)7 一 2.89 


(二 ) 车 两 总 体 方 差 不 相 等 即 中 关 吕 

若 两 总 体 方差 不 相等 ,Dr 一气 , 一 已。 的 抽样 分 布 不 再 是 ! 分布, 也 不 是 正 态 分 布 . 统 
计 学 上 一 般 用 1957 年 由 柯 克 兰 (Cochrany 和 柯 克 斯 (Cox) 提 出 的 检验 法 来 处 理 ， 
| 
了 本 可 
| 

的 分 布 只 是 近似 + 分 布 ,因而 不 能 查 :分布 表 得 到 临界 值 。 :的 临界 值 可 用 下 式 
计算 ， 


(公式 5 -8) 















全 


x " in Foy. * tar 


or Tot, 

公式 中 :om 和 or 分 别 为 两 个 样本 平均 数 抽 样 分 布 的 标准 误 15r。 为 上 值 表 中 与 = 水 
平 及 样本 1 自由 度 df 二 zm 一 1 对 应 的 临界 值 ytss 为 1 值 表 中 与 a 水 平 及 样本 2 自由 度 
g 户 二 一 ] 对 应 的 临界 值 。 

完成 上 述 + 和 4 的 计算 后 ,将 二 者 进行 比较 。 若 1 二 世 , 则 可 以 认为 两 个 样本 平均 数 
在 a 水平 差异 显著 ;否则 ,差异 不 显著 。 

【 例 5S-7] 某 心 理学 家 研究 发 现 , 小 学 三 ,四 年 级 学 生 的 创造 力 水 平 有 显著 差异 。 
有 人 随机 抽取 30 名 小 学 三 年 级 学 生 ,其 创造 力 测 验 平 均 得 分 为 80 分 ,标准 差 为 10 分 ; 随 
机 抽取 了 32 名 小 学 四 年 级 学 生 , 其 创造 力 测 验 平均 得 分 为 72 分 ,标准 差 为 6 分 。 假 设 两 
总 体 方 差 不 等 ,能 否 根 据 这 一 次 抽样 列 量 结果 证 实 读 心理 学 家 的 结论 7? 

【 解 】 因为 两 总 体 方差 不 相等 ,本题 中 的 平均 数 差 异性 检验 需要 使 用 柯 克 兰 (Coch- 
ran) 和 柯 克 斯 (Cox} 提 出 的 方法 。 已 知 :nm = 二 30,X 二 80,3, = 二 10;n, 一 32, 双 , 一 72 ,5 一 6 

研究 假设 H， Hl 入 

虚无 假设 H, :mi 二 ji 

应 用 公式 5-8 和 公式 5-9 计 算 ， 


= (公式 5=-9) 





rE 
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0—1 | 32—1 
Os “人 “ty 
Ln = i - 
. 二 
31 10° ; ; 7 B: 
| = > 
其 中 ,os 1 a6 3.4483 .0% rs : 1.1613 





查 表 得 ,fitsy 一 2.045 dfi=29 
lr) =2,.042 df=31 


:3.4483X2.045 二 1.1613X2.042 
ropy™ 4483 二 1 1613 a 
= p05 
( 滞 ) 


可 见 , 两 个 年 级 学 生 的 创造 力 水 平 有 显著 性 差异 ,这 一 次 测量 结果 验证 了 该 心理 学 
家 的 结论 ， 


和 生生 一 各 避 村 天 目 要 塘 内 坊 


-下班 辣 的 区 站 站 是 非 洁 般 量 它 





三 、 两 小 总 体 均 为 非 正 态 分 布 


当 两 个 总 体 为 非 正 态 分 布 时 ,样本 平均 数 差 异 量 的 抽样 分 布 不 符合 Z 分布 和 1 分 
布 , 但 是 在 两 个 样本 的 容量 都 大 于 30 时 ,分 布 趋 近 于 Z 俘 布 ,可 以 使 用 检验 , 记 为 ZZ 检 
验 。 检 验 公 式 是 ， 
有 
gin 十 本 


(两 总 体 方 差 已 知 时 ) [站 式 5-107 





二 一 一 本 i ,上 方 莽 方差 ) (a117 
性 体 方差 未 知 ,以 样本 方 莽 代替 总 体 方差 》 (公式 5 - 11 


四 、 方 差 齐 性 检验 

在 上 述 讨 论 中 ,有 关于 两 个 总 体 方 凑 相等 或 不 相等 的 假设 。 但 是 ,在 有 些 情况 下 ,只 
有 着 个 样本 的 数据 资料 ,并 没有 关于 两 个 总 体 方差 的 任何 资料 ,那么 如 何 判 定 总 体 方差 
是 否 具有 相等 性 昵 ? 统计 学 所 提供 的 方法 叫做 方差 齐 性 检验 ,其 中 * 齐 ”, 就 是 "相等 ”， 
“一致 : 之 总。 

方 凑 齐 性 检验 也 是 一 种 假设 检验 ,是 指 通 过 样本 方差 Si 和 的 差异 对 各 自 的 总 体 
方差 和 oi 是 否 有 差异 进行 推断 ， 

设 从 一 个 方差 为 af 的 正 态 总 体 中 随机 抽取 一 个 容量 为 由 的 样本 ,计算 其 中; 再 从 一 


个 方差 为 中 的 正 态 总 体 中 随机 抽取 一 个 容量 为 n 的 样本 ,计算 其 号 。 忆 得 到 一 个 F 


值 ,不 断 地 重复 这 一 过 程 ,可 以 得 到 无 数 个 下 值 . 统计 学 已 经 证 明 , 下 = 号 的 抽样 分 布 服 
从 于 分 子 自 由 度 为 df 一 一 1, 分 苹 自 由 度 为 d 记 = 一 1 的 下 分 布 .下 分 布 是 一 种 偏 
态 分 布 , 随 分 子 分 母 自由 度 不 同 而 旦 一 族 分 布 , 当 df, 与 df; 趋向 于 无 穷 大 时 ,下 分布 扑 
近 于 下 起: 

方差 齐 性 检验 中 ,建立 虚无 假设 及, :of = 于 。 如 果 一: 值 在 1 附近 波动 , 则 虚无 候 
没 成 立 , 即 方 莽 齐 性 ;如 果 这 个 比值 过 大 或 过 小 . 则 虚无 假设 被 拒绝 , 即 两 个 总 体 方差 不 
齐 性 。 

如 图 5-4 所 示 , 当 ma=0.05 时 ,如 果 Fo si) 一 让， ， 则 两 总 体 方 着 的 差异 性 未 达 
到 0.05 显著 性 水 平 , 方 差 齐 性 ;如 果 F<F., 本 或 F>F, ' 琴 总 体 方 差 的 差异 达到 了 
0.05 显著 性 水 平 ,方差 不 齐 性 。 由 于 下 分 布 为 偏 态 分 布 ,所 以 下 , 与 下 ,，。) 的 值 不 是 相 
反 数 ,但 是 下, 与 下 (，,) 互 为 倒数 ,所 以 下 分 布 表 中 只 列 出 了 不 同 自由 度 下 的 下 。 值 ， 在 
双 侧 检验 需要 F(，, ) 值 时 ,可 由 F， 求 倒数 得 到 。 为 了 查 表 方便 而 不 必 去 计算 F, 的 倒 
数 ,通常 在 下 检验 过 程 中 计算 下 值 时 将 S: 值 中 较 大 的 一 个 作为 分 子 , 较 小 的 一 个 作为 生 





(公式 5-12) 





图 5=-3 下 棕 验 示意 图 


【 例 5-8]】 请 对 例 5-6 和 例 5-7 中 的 方差 进行 齐 性 检验 . 
【 解 】 01》 对 倒 5-6 中 的 方差 进行 齐 性 检验 。 
根据 题 意 已 知 , 二 60,S==6: 二 36;yn, 二 56,3I 二 7 二 25 


查 附 表 4 的 下 值 表 ( 双 侧 检验 ) 得 到 :Fs ~=1. 67 
Fi. A4167, SS P005- 
两 个 方差 的 差异 未 达到 0.05 显著 性 水 平 ,接受 方差 齐 性 假设 。 
(2) 对 例 5-7 中 的 方差 进行 齐 性 检验 。 
根据 题 意 已 知 :mi = 一 30, 引 一 10240 一 32 5 一 人 
将 数据 代 人 公式 5- 12 得 到 :FF 二 Se 二 宇 二 100 一 2.78 
Snin SS 6 
分 子 自由 度 d= 二 30 一 1 二 29; 分 母 自由 上 庶 df;= 二 32 一 1 二 31 
查 附 表 4*F 值 表 ( 双 侧 检 验 )" 得 到 ,下 ,ss ==2.07 
F=2.7832.07, 2 Peo.05 
两 个 方差 的 差异 达到 了 10.05 显 着 性 水 平 ,方差 不 齐 性 


全 雪 这 贡 一 庚 委 了 采 避 立 夺 划 二 周 涡 


第 四 节 ”相关 样本 平均 数 的 差 开 检验 


所 谓 相关 样本 ,是 指 两 个 样本 的 数据 之 间 存 在 一 一 对 应 的 关系 。 相 关 样 本 一 般 在 两 
种 情形 下 产生 :一 是 采用 配对 组 的 实验 设计 ;二 是 采用 同一 样本 前 后 测 和 设计。 由 于 相关 
样本 的 一 个 样本 中 ,每 一 个 数据 都 有 男 一 样本 中 的 一 个 数据 与 它 唯 一 对 应 ,所 以 两 个 样 
本 容量 相等 。 这 种 相 美 性 必然 带 来 两 个 样本 间 数 据 关 系 的 一 些 变化 ,所 以 平均 数 的 差异 
性 检验 也 与 独立 组 样本 间 的 检验 有 所 不 同 。 


一 、 两 个 总 体 均 为 正 态 且 方 差 均 已 知 


两 个 总 体 均 为 正太 分布 且 方 差 已 知 时 ,两 个 样本 平均 数 之 羞 Ds 的 抽样 分 布 符合 正 
春分 布 , 可 以 采用 工 检 验 来 完成 样本 平均 数 的 差异 显著 性 检验 。 





下 全 的 区 下 芒 果 闫 于 蔓 商 总 
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08 


1 


车 变量 i 与 Y 的 相关 系数 r 已 知 , 则 65 一 一 2 5， to 
同样 可 以 得 到 :oo， =oF% ros os 十 or 


十 


即 网 = 全 2 ( 公 武 5-13) 


全 而 
不 难看 到 , 当 + 一 0 时 上 式 就 是 公式 5 - 2, 所 以 独立 样本 实际 上 就 是 相关 样本 的 
特例 ， 
天 [一 沈 1 
相关 样本 的 Zz 检 验 公 式 仍 然 是 Z= 





try 

【 例 5s-9] 某 心 理学 家 随机 抽取 了 一 小 学 36 名 刚 人 学 的 儿童 进行 击 氏 智力 测验 (ca 
三 15) ,结果 平均 智商 为 110。 一 年 后 又 对 同 组 被 试 进行 了 重 测 ; 结 果 平 均 智商 为 115。 
已 知 两 次 智力 测验 结果 的 相关 系数 为 r 一 0.07。 问 :能 和 理 认 为 经 过 一 年 的 小 学 教育 及 年 
龄 的 增长 ,儿童 的 智商 有 了 显著 的 提高 ? 

【 解 了 其 为 前 后 测 研 究 ,前 后 使 用 的 是 同一 批 被 试 , 所 以 两 组 数据 是 相关 样本 。 

已 知 :n=36,0 三 15,X 二 110, X==115 

研究 假设 是 Hi ;jp 二 

建立 虚无 假设 Hs ;jp = jp 

将 已 知 条 件 代 人 公式 5-13 得 到 ， 






于 2 于, 时 十 村 = 丘 。 V3 一 好 


于 三 3 
Ly pl 旭 Vn 于 Wa 
15 
=— ya—2x0.7=1,936 
a6 
到 一 天 
所 以 Z 检验 的 统计 量 :2== 了 一 2 一 D1 一 一 2. 583 


wm 


令 ga 二 0.01, 查 附 表 2 的 正 态 分 布 表 , 在 单 侧 检 验 时 ;Zo ==2.33 
[Z|=2,583 2 3 = P,Q0] 
可 见 , 前 后 两 侈 测量 结果 有 显著 性 差异 ,可 以 认为 至 过 一 年 的 小 学 教育 及 随 痢 年 龄 
的 增长 ,这 些 儿 童 的 智商 有 了 显著 提高 ， 


二 、 两 个 总 体 均 为 正 态 但 方差 未 知 


此 时 ,Dz 的 抽样 苍 布 为 :分布 ,可 以 用 检验。 因为 相 关 梓 本 的 数据 是 成 对 的 ,所 以 ， 
可 先 计算 对 应 数据 的 差异 量 (d) ,把 对 ( 忒 , 一方 :) 的 显著 性 检验 转化 为 对 豆 的 显著 性 检 
验 ， 该 情况 下 的 检验 不 需要 事先 做 方差 齐 性 检验 。 

用 d; 表示 每 一 对 对 应 数据 之 差 , 即 十 一 时 一 Xi 其 中 和 于 5 分别 表 示 取 自 样 本 
1 和 样本 2 的 第 i 对 数据 ,显然 : 


d 值 的 平均 值 为 。 如 = 4 有 Ps. _ A 
z er 
| (d— 2): = 
让 入 汐 才 区 汶 。。 席 二 2 全 -人 


神 一 】 福 一 】 


因此 ,也 抽样 分 布 的 标准 误 为 : 





5 |- 








人 
于 是 :检验 的 统计 量 为 ， 
二 TY， — 到 y= 已。 
了 人 
ns | a (Sd) 
2d 于 
| ntn—1) 
a (公式 5-15) 
] 于 (Yd) 
n YY 【天 一 下 + 
自由 度 洲 ; df=n—1 Ce 5- 16) 


【 例 5-10】 下 表 所 列 为 10 名 初 二 学 生 期 中 和 期 末 的 数学 考试 成 绩 。 问 :期 中 和 期 
未 的 成 绩 有 无 显 着 差异 ? 


表 5-2 数学 考试 成 绩 
被 试 | 2 | 本 号 四 昌 | 10 丰 
匣 中 70 0 70 75 84 均 
期 束 ml | 86 58 OD 0 B66 与 有 a0 7 
a 19 15 5 2 了 B ] 12 25 之 异 
【 解 】 根据 题 意 , 设 下 ,为 期 中 平均 成 绩 , 玉 ,为 期 末 平 均 成 绩 。 则 ， 检 
区 ,二 77.7, 太 :二 65.2，》 nd 二 125，9 1 小 二 2209,( 3 1d) = 二 15625 将 已 知 数据 代 人 人 EF 
公式 5-15 可 得 ; H 
A 元 一 天 | 

hn a) 

| ee 

77.7— 65.2 


te 一 .人 bd 
i> /10 x 2209— 15625 
10 【1 一 1 
查 上 值 表 可 一 一 1 一 9 时,( 呈 ) 一 2 262 
让 一， 站 5 
学 生 的 前 后 两 次 考试 成 绩 在 0.05 显著 性 水 平 上 存在 显著 性 差异 ， 


三 、 两 个 总 体 均 为 非 正 态 分 布 


当 两 个 总 体 均 为 非 正 态 分 布 时 ,样本 平均 数 差 异 量 的 分 布 不 符 台 工分 布 和 + 分 布 ， 
但 在 两 个 样本 容量 均 大 于 30 时 ,该 抽样 分 布 趋 近 于 正 态 ,所 以 可 采用 近似 的 2 检验 , 即 
Z 检验。 


CTT le er 
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(公式 5 一 17) 


( 公 址 5-18) 





EE 


第 五 市 上 检验 的 SPSS 过 程 


SPSS 单 样本 1 检验 是 检验 一 个 数据 样本 所 在 总 体 的 平均 数 与 某 指定 值 之 间 的 差异 
性 ,统计 检验 的 前 提 是 样本 所 在 的 总 体 服 从 正 态 分 布 。 下 面 以 具体 实例 演示 单 样 本 1 检 
验 的 SPSS 过 程 。 

【 例 5-11] 某 班级 学 生 在 参加 学 校 年 级 会 考 时 ,全 班 同学 的 数学 成 绩 如 甫 5 -3 所 
示 。 已 知 全 校 学 生 的 平均 成 绩 为 80 分 ,请 问 该 班 同 学 的 成 绩 与 全 校 同学 的 平均 分 相 比 
是 和 理 具 有 显著 性 差异 。 


表 5-3 数学 成 绩 表 





【 解 了 根据 第 二 章 所 述 的 方法 建立 正确 的 数据 文件 , 歼 据 文件 中 包 舍 一 列 数据 ， 
以 变量 名 "math”" 标 记 , 而 每 个 学 生 作 为 一 个 个 案 占 据 一 行 。 然 后 按照 以 下 步骤 进行 操 
作 : 

步骤 1: 单 击 药 单 “点 nalyze” 选择 “Compare Means” 中 的 "One-Sample 本 test" 靖 仿 ， 
打开 如 图 5-5 所 示 的 对 话 框 。 





图 5=5 单 梓 素 检验 对 语 杠 


步骤 2; 将 对 话 框 志 侧 变量 列表 中 的 变量 “math" 轿 人 右 侧 ”Test Variable(s) 下边 
的 方 框 中 ,然后 在 "Test Value" 布 边 的 小 塘 框 中 输 人 全 年 级 学 生 数 学 的 总 平均 分 
“BO , 
步骤 3; 单 击 对 话 框 上 的 “OK* 按 钮 ,输出 统计 分 析 结果 , 主要 包括 两 个 表格 ， 
过 5-4 人 nc-Sarmple Statisties 


| . Mean Std. Deviation Srd., Error Mean 


MATH 45 了 .了 333 8. B79 ,62 


表 5-5 Onesample Test-Test Value=$0 


95% Confidence Interval 
i df SiE,” C2-tailed) Mean Differenee 一 
Lower Upper 





MATEH 一 .39 本 并 .D1 3. 2667 — 5 Br9g —. B35 


RE VE 
输出 的 第 一 个 表格 ,主要 包括 数据 样本 的 一 些 描述 性 统计 分 析 结 果 :45 个 学生 的 数 
学 平均 值 为 76.73, 标 准 差 为 &.70, 均 值 抽样 分 布 的 标准 误 为 1. 30; 输 出 的 第 二 个 表格 二 
1 检验 的 结果 ;样本 数据 平均 数 与 年 级 均 分 差异 量 为 一 3. 267 ,1 一 一 2.519,dj 二 和, 记 二 
0.015-0.05。 可 以 认为 该 班 同学 的 均值 与 全 年 级 的 数学 平均 值 有 显著 性 的 差 措 。 


二 、 两 独立 样本 上 检验 


独 二 样本 平均 数 的 差异 + 检验 的 前 提 是 ;(1) 两 个 样本 应 是 互相 独立 的 , 即 从 一 总 
体 中 抽取 一 批 样本 对 从 另 一 总 体 中 抽取 一 批 样本 没有 任何 影响 ,两 组 样本 个 案 数 目 可 
以 相同 ,也 可 以 不 相同 ,个 案 顺 序 可 以 随意 调整 ;i2) 样 本 来 自 的 两 个 总 侍 应 该 服从 正 
态 分 布 。 
[ 例 5-12】 分 别 从 两 个 班级 随机 抽取 12 名 学 生 , 分 析 他 们 某 一 项 心理 能 力 测试 分 
数 的 平均 数 是 理 存 在 显著 性 差异 。 测 试 的 分 数 如 表 5-6 所 示 。 
表 5-6 抽取 来 的 学 生 的 心理 能 力 测 试 分 数 





【 解 了 根据 第 二 章 所 述 的 方法 建立 正确 的 数据 文件 ,数据 文件 中 包含 两 列 数据 。 一 
列 数 据 表 示 被 测试 的 学 生来 自 于 哪个 班级 ,以 变量 名 "Class” 标 记 ; 变 量 值 有 1 和 2, 分 别 
表示 被 试 来 自 1 班 和 2 班 ; 另 一 列 数据 是 学 生 心 理 能 力 测 试 的 分 数 ， 以 变量 名 "Score” 标 
记 , 每 个 学 生 作为 一 个 个 案 占 据 一 行 。 然 后 按照 以 下 步骤 进行 操作 ， 

步骤 1; 单 击 荣 单 *Analyze” 选择 ”Compare Means” 中 的 “Independent-Sample 工 
test”" 命 令 , 打 开 如 图 5-6 所 示 的 对 话 框 ， 

步骤 2 ;将 对 话 杠 左 侧 变量 列表 中 的 “Score" 变 量 置 人 右 侧 "Test Variables" 下 的 方 框 
中 ;将 恋 量 "Class" 置 人 “Grouping Variable "下 面 的 小 方 框 中 , 单 击 ”Defina Groups...“ 按 
钮 ,打开 定 广 分 组 变量 水 平 的 对 话 框 定 文 组 别 , 如 图 5-7 所 示 。 


vv ass 名 三 评 茧 一度 委 栖 否 屿 目 要 项 出 六 


全 


上 


了 芭 果 剧 才 区 半 它 ， 





加 5~6 省 站 样 末 + 圈 验 的 让 对 请 晶 


此 最 3: 单 击 “Continue" 按 钮 返回 "Independent 
samples T Test" 主 对 话 框 .如 图 5-6 所 示 , 单 击 
“OK" 按 和 钮 , 即 输出 所 需要 的 分 析 结 果 。 输 出 的 结 
来 主要 包括 两 个 表格 :一 个 表格 中 的 数据 是 美 于 
两 小 数据 样 相 的 描述 性 统计 分 析 娃 果 , 主要 反映 
两 个 数据 样本 的 个 案 数 ,平均 数 .标准 差 和 标准 误 
靠 信 息 , 如 表 5-? 所 示 ; 另 一 个 表格 中 的 数据 是 

检验 结果 .检验 结果 等 。 
表 5-7 Growp Satisties 








(lass Mean Srd. Deviation Sld. Error Mean 
IT 1. a0 12 F667 5., 19816 2 B5528 
3. 00 1 有 5, B667 16. dF 3 DO05E9 





由 表 5-? 可知 ,来 自 一 班 和 二 班 的 样本 平均 数 盆 别 汶 77.67.75. 67, 标 准 闫 芬 别 为 
9,20,10. 41, 标 惟 误 俘 别 为 2. 86,3.01，, 
表 5-8 Independent Samples Test 


[evene's est for . 
. J t-teat [or Equality of Means 
Equnlity of Varianees 








F 本 df SEE. Mlean Std, Error 
3 Si. 3 ” 
”ailed) Thfference Difference 
Equnl varimees nasauned +206 654 ,99 22 .B24 2. 0000 ed 
Eaual variancea not asstmed | A 21.670 623 2. D000 时: 有] 了 


表 5-8 中 结果 分 两 行列 出 ,其 中 第 一 行 的 结果 是 方差 齐 性 条 件 满 是 (Equal vari- 
ances assumed) 时 可 以 伍 用 的 结果 ;第 二 行 的 铺 果 是 方差 齐 性 条 件 和 满 足 (Edqual vari- 
ances nol assamedy 时 可 使 用 的 姑 果 。 
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在 结果 使用 中 ,首先 要 看 方差 齐 性 检验 的 结果 , 即 "Levene s Test for Equaltty of Va- 
riances” 一 栏 中 的 结果 ,本 例 中 方差 齐 性 检验 的 结果 是 下 = 二 0. 206, 显 著 性 水 平 p 二 Sig. 一 
0.654 二 0.05, 未 达到 显著 性 水 平 , 说 明 方 差 齐 性 条 件 成 立 , 使 用 第 一 行 的 检验 结果 。 如 
果 方 差 齐 性 条 件 不 成 立 , 则 使 用 第 二 行 的 1 检验 缚 娄 。 

根据 第 一 行 的 1 检验 结果 可 知 ,本 例 样 本 平均 数 的 差异 量 为 2.00,1 王 0, 499,dj 一 
22,b 一 0.623, 即 伴随 概率 未 达到 0.05 的 显著 性 水 平 。 因 此 ,可 已 认为 两 个 班级 学 生 的 
平均 成 绩 差异 未 达到 显 闭 性 水 平 。 


三 、 两 配对 样本 上 检验 


前 文 已 经 指出 ,配对 样本 1 检验 的 两 个 数据 样本 来 自 于 两 种 情况 :一 种 情况 是 配对 组 
实验 涉及 的 数据 资料 , 即 在 研究 一 个 变量 的 改变 是 理会 引起 被 试 某 种 心理 或 行为 的 改变 
时 ,排除 这 -研究 变量 ,根据 其 他 与 被 试 的 这 些 心理 或 行为 可 能 有 关 的 因素 对 被 试 进行 
南 对 分 组 ,使 得 两 个 被 试 组 上 共有 一 一 对 应 的 美 系 ,由 此 得 到 的 两 个 数据 样本 也 具有 rt 
对 应 的 关系 ; 男 一 种 情况 是 ,由 一 组 被 试 在 两 种 不 同情 况 下 ,接受 某 种 行为 倾向 或 心理 能 
力 的 测试 ,得 到 两 个 数据 样本 ,两 个 样本 的 数据 间 也 具有 一 一 对 应 的 关系 。 

本 对 组 的 数据 样本 容量 是 一 致 的 ,具有 一 定 的 相关 性 ,所 以 也 叫做 相关 样本 。 在 老 
异性 1 检验 中 也 要 考虑 其 相关 性 ， 正如 前 文 已 经 看 到 的 ,在 计算 样本 平均 数 差异 量 抽样 
务 布 的 标准 误 的 公式 中 包含 了 两 个 样本 之 间 的 相关 系 至 。 

现在 我 们 以 具体 的 例子 说 明 配 对 组 1! 检验 的 SPSS 过 程 。 

[ 例 5-13] 某 一 小 班 教学 实验 班 的 学 生 接受 了 一 项 教学 实验 , 即 接受 新 的 等 习 
方法 的 训练 ,在 训练 前 和 训练 后 ,使 用 标准 化 的 测试 试卷 分 别 测试 了 他 们 的 数 竺 成 绩 
和 黄 语 成 绩 ,如 图 5-8& 所 示 。 试 分 析 学 生 数 学 和 英语 前 后 测 的 成 绩 是 否 存 在 显著 性 
兰 异 。 





baizhi 65.00 79.00 78.00 87.00 
guitian 70.00 70.00 89.00 88.00 
wnagli 80.00 81.00 68.00 79.00 
niue 76.00 90.00 70.00 9.00 
nipul 68.00 63.00 50.00 39.00 
jan 64.00 70.00 67.00 ES8.00 
ET 72.00 75.00 78.00 ga.00 
heini 54.00 69.00 89.00 TB.00 
wingg 56.00 79.00 56.00 89.00 





回 5-9 配对 翌 本 【办 验 的 数据 交 忻 水 基 图 


相册 季 蔡 导 戎 二 财 注 


一 间 芭 六 古人 疙 盯 剧 于 汝 疝 己 





自 先 按照 前 文 介绍 过 的 方法 建立 正确 的 数据 文件 .在 这 一 研究 中 ,共有 24 名 被 试 ， 
每 一 被 试 均 有 四 项 测试 分 数 , 所 以 数据 文件 的 数据 区 必须 是 24 行 和 四 列 烤 据 , 要 贯彻 一 
个 个 案 占 一 行 , 一 项 测试 分 数 占 一 列 的 基本 原则 ， 数据 文件 的 数据 区 如 图 5 -8 所 示 。 具 
体 的 SPSS 分 析 过 程 是 ， 

步 又 1: 单 击 菜单 “Amnalyze" 选 择 “Compare Means” 中 的 "Paired-Samples T test* 命 
邻 , 打 开 如 图 5 -9 所 示 的 对 话 框 ， 





图 5= 配对 样本 证 检 驻 的 主 对 活 杠 


步骤 2: 从 对 话 框 左 侧 的 变 基 列表 中 先后 选中 “数学 1" 与 "数学 2”.* 英 语 1" 与 “英语 
2" .形成 籼 个 配对 变量 。 点 击 对 话 框 上 的 " 国 加 "按钮 ,两 队 变 量 被 性 人 右 侧 的 “Paired 
Variables" 变 最 框 中 ,如 图 5-9 所 未 。 

步 又 3: 单 击 “OK" 按 钮 ,输出 分 析 结 果 。 这 一 分 析 过 程 输出 的 结果 主要 所 括 三 个 表 
格 , 其 中 第 一 个 表格 如 表 5-9 所 示 , 它 反映 四 个 数据 样本 的 描述 性 统计 分 析 结果 ,包括 各 
个 数据 样本 的 平均 数 ,标准 差 和 标准 误 。 


表 5-9 Paired Samples Statistics 
Oi i 








Mlean N Std. Deviatian Std, Error Mean 
Fairl 数学 1 18, BE6T 24 13.34384 2 T2480 
数字 2 76, B66T 34 9, 66242 1. 97233 
Pair2 英语 1 78. 3750 24 15, 74198 4. 21332 
英语 2 B89. 6250 24 ?0054 l: B1269 


一 

输出 的 第 二 个 表格 如 表 5-10 所 示 , 主 要 反映 两 个 配对 数据 样本 的 相关 系数 (相关 系 
数 的 概念 将 在 后 续 章节 中 专门 介绍 ) 及 显著 性 水 平 。 从 表 中 数据 看 出 ,数学 1 与 数学 2 
之 间 的 相关 系数 为 0.746, 显 著 性 检验 得 到 的 伴随 概率 记 =0. 000 一 入 001, 达 到 极 显著 的 
水 于 ,说 明 前 后 两 次 测验 的 数 党 成绩 美 联 性 很 高 ;英语 1 与 英语 2 的 相 美 系数 等 于 
0.263, 显 著 性 检验 得 到 的 伴随 概率 pp 二 0. 214 二 0.05, 未 达到 显著 性 水 平 ,说 明 前 后 两 次 
测验 的 英语 成 绩 美 联 性 很 低 。 


囊 5-10 Paired Samples Correlations 


NN Correlatiomn SiE. 
Pair ] 数学 1&. 数学 2 2 D0. 74 ,Dod 
Pair 2 葛 语 1 外 莫 语 2 24 ,263 :21 


输出 的 第 三 个 表格 是 /检验 的 主要 结果 ,如 表 5-11 所 示 。 使 用 新 教学 方法 前 后 数 
学 和 英语 成 绩 差 值 序列 的 平均 值 分 别 为 一 8&.00 和 一 11. 25, 计 算出 的 1 统计 值 分 别 为 
一 4.41 和 一 3.52 ,伴随 概率 分 别 为 0.000 和 0.002, 均 达到 显著 性 水 平 。 也 就 是 说 ,使 用 
新 教学 方法 前 后 数学 和 英语 成 绩 都 有 了 明显 变化 ,从 两 个 样本 的 平均 值 可 以 看 出 ,使 用 
新 教学 方法 后 的 成 绩 比 使 用 前 的 成 绩 要 高 。 


表 5-11 Paired Samplbess Test 


Paired Dillerenecea 51E: 
型 扩 
Mean Std, Dewiation Std, Error Mean 2-railed) 
Pair 1 和 获 学 1 一 和 数学 2 一 8&,000 8B. 88575 l; 18138 一 让 ;二 下 “时 ;0D0 
Pair 2 莫 语 1 一 英语:2 一 11; 250 15, 84622 3 19377 一 占 B23 ,和 机 
| 时 
E> 
一- 于 夏 习 轧 者 与 练习 是 一 bosp 9 
者 
1. 在 某 空军 招 飞 测试 中 ,对 报名 者 进行 了 红 光 刺激 条 件 下 的 简单 反应 时 间 的 测试 ， 时 


平均 为 175ms ,标准 盖 为 15ms。 随 后 从 中 抽取 了 25 人 进行 绿 光 刺 激 的 简单 反应 时 间 的 。 异 
测试 ,结果 得 到 平均 值 为 182ms。 那 么 您 认为 这 些 报名 者 从 总 体 上 讲 , 在 绿 光 刺 汕 下 会 | 
反应 慢 一 些 吗 ? 验 

2. 心理 学 家 对 某 大 学 少年 班 的 36 名 学 生 进行 了 韦 克 斯 勒 智力 测验 (y= 二 100,a 二 时 
15), 铺 果 ;这些 消 年 班 大 学 生 的 平均 智商 为 122 ,标准 差 为 9。 那 各 是 否 可 以 认为 这 些 少 
年 班 大 学 生 的 智商 高 于 一 般 人 的 平均 水 平 7 

3, 已 知 某 项 假设 检验 得 到 的 尾随 概率 是 二 0.08。 这 个 数字 代表 的 意思 是 什么 ? 
如 果 这 时 否定 虚无 假设 ,犯错 误 的 概率 或 风险 有 地 大” 如果 接受 虚无 假设 ,犯错 误 的 概 
率 或 风险 有 包 大 ? 

4. 某 商 场 信息 部 发 布 消息 .声称 平均 每 天 顾客 其 达到 50 干 人 。 市场 调查 者 随机 
调查 了 16 天 ,结果 平均 每 天 进入 商场 的 顾客 人 数 为 1,8 和 干 人 ,标准 差 为 0.8 千 人 。 请 你 


判断 该 商场 有 无 明显 夸 太 其 顾客 量 ? 

5. 某 49 人 班级 的 全 体 同 学 参加 了 全 区 数学 竞赛 ,结果 平均 分 为 76 分 ,标准 差 为 15 
分 ,请问 读 班 成 绩 与 全 区 平均 的 80 分 相 比 有 明显 差距 吗 ” 

6. 为 了 研究 摄 人 酒精 对 驾驶 汽车 动作 的 影响 , 某 研究 者 抽取 20 名 成 年 司机 ,随机 分 
成 相等 的 两 组 。 一 组 摄 人 一 定量 的 酒精 ,一 组 未 摄 和 人 酒精 ,然后 要 求 他 们 在 驾校 的 救 练 


场 驾 驶 汽车 半 个 小 时 ，。 婧 果 每 一 2 
摄 人 酒精 组 草 车 臣 离 (mi3.5 3.0 4.5 28 50 40 2.6 50 4.5 60 
未 摄 人 酒精 组 刹车 距离 (m):3,2 25 25 10 3.5 20 2.0 1.5 


试问 :酒精 对 司机 的 驾驶 操作 有 明显 影响 吗 ? 
7, 为 研究 启发 式 教学 的 效果 , 现 从 某 校 初 二 年 级 随机 抽取 两 个 平行 班 的 学 生 , 其 中 
一 个 班 的 50 名 学 生 作 为 实验 组 , 男 一 个 班 的 48 名 学 生 作为 对 照 组 。 由 同一 位 教师 进行 
物理 同步 教学 ,实验 组 采用 启发 式 教 学 法 ,对 照 组 采用 传统 讲授 法 。 一 个 学 期 后 进行 统 
一 测试 ,第 委 实验 组 平均 分 为 63 分 ,标准 差 为 6 分 :对 照 组 平均 分 为 54 分 ,标准 莽 为 7 


分 。 能 否 根 据 这 一 结果 做 出 “启发 式 教 学 的 效果 显著 优 于 传统 讲授 法 "的 结论 ? 


8. 表 5 一 12 中 数据 是 对 12 名 技工 学 校 学 生 进 行 某 项 劳动 技能 实地 训练 前 后 的 技能 


测试 成 绩 , 间 实地 训练 是 否 有 效 地 提高 了 该 项 劳动 技能 的 水 平 ? 


三重 和 和 WT 导 守 此 山 语 : 
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甫 5-13 盾 工 技能 培训 效果 检验 测量 数据 
学 生 十 县: 和 名 加 二 1 二 





训 永 前 45 和 别 57F 6&1 43 5 70 59 4 9 4 
训 红 :后 Hg 56 67 7 





9, 惜 助 于 SPSS 系统 完成 第 6 和 第 8 题 中 的 统计 检验 ， 


第 六 章 方差 分 析 
Con 


对 三 个 以 上 的 数据 样本 进行 差异 性 检验 的 时 候 , 要 使 用 方差 分 析 。 方 差分 析 的 基本 
原理 是 : 先 计算 多 个 数据 样本 总 的 变异 量 , 将 其 分 解 为 各 个 研究 变量 的 变化 效应 (包括 主 
效应 和 交互 效应 ) ,并 与 随机 误差 的 方差 相 比 较 , 研 究 变 量 的 效应 方差 是 否 达 到 显著 性 水 
平 。 至 于 分 解 后 剩余 的 部 分 则 叫做 残 差 , 残 差 是 研究 变量 之 外 的 因素 引起 的 变异 量 。 本 
章 详细 介绍 了 心理 学 研究 中 常用 设计 模式 所 对 应 数据 的 方差 分 析 程 序 以 及 在 SPSS 系统 
中 实现 的 过 程 ,主要 包括: 单 因 素 完全 随机 实验 设计 的 方差 分 析 、 单 因素 重复 实验 设计 的 
方差 分 析 、 多 因素 完全 随机 实验 设计 的 方差 分 析 。 此 外 ,还 专门 分 析 了 研究 变量 的 主 效 
应 与 交互 效应 的 关联 性 。 


在 平均 数 差异 显著 性 的 + 检验 中 ,数据 样本 只 有 两 个 。 但 在 心理 学 及 其 他 行为 科学 
领域 ,研究 者 常常 需要 对 三 个 .四 个 甚至 更 多 的 数据 样本 同时 进行 差异 的 显著 性 检验 ,这 
就 不 能 直接 使 用 t 检验 方法 ,而 是 要 使 用 方差 分 析 方 法 。 


第 一 节 ”方差 分 析 的 基本 原理 


我 们 已 经 知道 , 离 差 平方 和 (简称 平方 和 ,sum of square, 常 表示 为 SS) 是 数据 样本 变 
异 量 的 良好 测量 指标 ,而 平均 的 离 差 平方 和 称 为 均 方 ,也 就 是 方差 (variance)。 顾 名 思 
义 , 方 差分 析 (analysis of variance, 简 称 ANOVA) 就 是 对 数据 样本 变异 量 的 分 析 , 它 能 够 
将 多 个 因素 在 导致 数据 样本 变异 过 程 中 的 平均 贡献 分 离 出 来 并 进行 比较 。 在 心理 学 领 
域 ,研究 者 往往 是 在 多 变量 结合 的 不 同 条 件 下 对 被 试 的 心理 或 行为 进行 测量 ,得 到 的 数 
据 必 然 存 在 变异 性 ,而 其 变异 的 原因 除了 研究 者 有 意 改 变 的 测量 条 件 和 被 试 特征 差异 
外 ,还 有 各 种 难以 控制 的 随机 因素 。 通 常 ,研究 者 想 知 道 的 是 ,有 意 改 变 的 变量 或 明显 的 
被 试 特征 差异 是 否 明 显 导 致 了 测量 数据 的 改变 ,进而 查 明 该 变量 与 被 试 的 心理 或 行为 是 
否 存在 密切 ,甚至 因果 关系 。 方 差分 析 的 逻辑 基础 或 假设 前 提 就 是 数据 变异 量 的 可 加 性 
或 可 分 离 性 。 


一 、 变 异 量 的 可 加 性 
如 何 理解 数据 变异 量 的 可 加 性 呢 ? 我 们 来 看 这 一 假设 的 研究 示例 : 


| 识 
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闻 此 半 襄 : 
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[ 例 6-1] 某 研究 者 将 来 自 一 个 班级 的 18 名 男 大 学 生 随 机 分 成 了 相等 的 三 个 组 ， 
每 组 6 人 ,然后 在 A .As .A, 三 种 不 同 激励 气氛 下 ,分 别 要 求 三 组 害 试 将 一 重 物 举 至 启 
部 以 上 高 度 并 尽量 坚持 举 起 较 长 的 时 间 , 记 录 各 被 试 举 起 重 物 坚持 的 时 间 , 以 秒 为 单位 。 
结果 列 人 表 6- 1。 

囊 5 -1 不 同 灌 励 气 氛 下 被 惰 的 举重 时 间 [s) 





其 区 13 19 


A = 14 


表 65-1 中 共有 18 个 测量 结果 ,首先 将 其 看 作 是 一 个 大 的 数据 样本 。 按 照 自 变量 的 
水 平 ,数据 又 分 为 三 个 组 即 ) 一 1.2.… 愉 =1.2.3, 代 表 数 据 来 自 三 个 不 同 的 实验 条 件 ,每 
组 有 56 个 数据 即 1.2 .上 且 m 一 5, 代表 每 组 有 8 个 被 观测 对 象 ， 直 观 地 分 析 , 表 
6 -1 中 所 有 数据 的 变异 量 可 以 分 解 为 两 部 分 ;一 部 分 反映 各 组 数据 之 间 的 变异 程度 ,一 
部 和 分 反映 各 组 内 部 数据 间 的 变异 程度 。 那么, 数据 样本 的 总 变异 量 是 理 就 等 于 这 两 部 分 
变异 量 相 加 呢 ? 

下 边 我 们 用 离 差 平 方 和 的 计算 公式 对 数据 样本 的 变异 量 进行 计算 和 分 析 。 在 计算 
实施 之 前 ,为 了 表达 的 便利 ,这 里 规定 :全 部 个 案 数 用 N 表示 ,小 组 个 案 数 用 表示 ,符号 
对 应 的 下 标 用 i 表示, 即 i 二 1 一 n; 第 一 个 研究 变量 的 水 平 数 用 上 表示 ,将 观测 数据 划分 为 
上 组 , 符 导 对 应 的 下 标 用 j 表示 , 即 ;一 1 一 如 如 果 有 第 二 个 研究 变量 , 它 的 水 平 数 用 9 表 
示 ,将 观测 数据 划分 为 g 组 ,符号 对 应 的 下 标 用 -~ 表示, 即 * 王 1 一 9。 若 有 更 多 研究 变量 ， 
再 另行 规定 ,下 面 对 示 例 6- 1 的 数据 进行 分 析 。 

数据 总 变异 量 等 于 全 部 数据 组 成 的 数据 样本 的 离 差 平 方 和 (简称 平方 和 ) ,用 SS, 表 
示 , 即 ， 


SS 一 PS CR (公式 6-1) 
公式 6-1 说 明 : 先 计算 每 一 个 数据 区, 与 总 平均 数 , 的 离 差 平方 得 (X 一 X 和, 然 
后 将 革 一 组 内 数据 与 总 平均 数 的 离 差 平方 求 和 得 1 (X, 一 页 )*, 再 将 j 一 1 一 上 各 组 计 
由 加 
算得 到 的 离 差 平方 和 相 加 得 到 >》 (X, 一 总 7) 。 
现在 ,我 们 先 对 一 组 数据 的 离 差 平 方 和 计算 公式 作 进一步 的 变换 , 即 ; 
SX, 一 所 ,7 = SCX， 一 尼 , 一 天 十 着 和 2 一 SOX, 一 下 十 (一 碎 ,)] 
j= | £= i= | 
2 pe 一 Ew (NX C—O (A CAN] 
jo] 


Pp -2 XR, -SR 一 江 ,) 十 pe — 
j= | l= te 有 

该 公 式 中 ; 2 (Ni 一 名,) 一 01 即 一 组 数据 内 部 的 离 差 之 和 等 于 0); 对 某 一 确定 的 数 
据 样本 来 说 ,( 玉 ,一 不,* 是 一 个 常数 ,所 以 21( 驶 一 部) 二 n(X, 一 又 )* ,于 是 得 到 ， 


yx, — ,= SX, 一 况 ,) 十 W(t 一 六,): (从 起 6 一 2) 
公式 868-2 说明; 某 一 组 数据 与 总 平均 数 的 离 差 平方 和 等 于 组 内 数据 的 离 莽 平方 和 
S1CX, 一 总 )# 加 上 该 组 平均 数 与 总 平均 数 离 莽 平方 的 n 售 ,n(; 一 让)* 反映 了 该 组 内 


1 个 数据 平均 来 看 都 与 总 体 平均 数 有 一 个 离 差 (X) 一 六 ,)。 
特 各 组 计算 得 到 的 离 差 平 方 和 相 加 得 到 总 的 离 差 平方 和 , 即 : 


上 
55 = 3 [30 一 天 天 十 网 贺 一 融和] 
1 一 | i=1 


Sn (公式 6-3) 
tei ft j= | 
公式 6-3 说明; 该 公式 计算 的 是 全 部 数据 的 总 体 离 差 平方 和 ,反映 全 部 数据 的 总 变 
异 量 。 它 由 两 部 分 组 成 :一 部 分 是 》， CN 一 访 ,)*, 先 计算 每 组 内 部 数据 的 离 差 平方 
jl Me : 
和 ;再 将 各 组 计算 的 靖 果 机 如 得 到 ,所 以 是 总 的 组 内 变异 量 , 可 用 SS, 表示 ; 男 一 部 分 是 
n> (区 一 部 )2 ,从 平均 来 看 , 某 一 组 内 每 个 数据 与 总 体 平 均 数 的 高 差 平 方 和 ,相当 于 以 
每 组 数据 的 平均 值 取 代 组 内 所 有 数据 后 再 计算 各 组 数据 与 总 平均 数 的 离 差 平方 并 相 加 ， 
最 后 将 各 组 计算 的 半 果 相 加 ,这 样 得 到 的 变异 释 排 除了 组 内 变异 , 友 机 的 是 组 间 变 异 , 可 
用 SS, 表示 。 所 以 ， 

55, 一 S5S. 十 S5， (公式 6 一 4) 
公式 6 一 4 中 ;SS 代表 离 盖 平方 和 或 简称 平方 和 .下 标 上 代表 全 部 (total) .下 标 到 代 
表 组 内 twithin group) ,下 标 几 代表 组 间 (between groups} ,数据 样本 的 总 变异 量 SS, 等 
于 组 内 变异 量 SS, 与 组 间 变 异 量 SS, 之 和 ,此 公式 的 推导 过 程 直观 反映 了 变异 量 的 可 加 

性 ,是 方差 分 析 的 还 辑 基 础 ， 
很 显然 ,变异 量 是 与 数据 个 数 或 组 数 有 闫 的; 即 与 自由 度 的 太 小 有 关 。 要 想 比 较 组 
间 变 化 因素 和 组 内 变化 因素 对 市 试 结 果 的 影响 力 友 小 ,应 该 使 用 平均 的 变异 量 , 即 均 方 ， 
也 就 是 方差 , 它 等 于 变异 平方 和 除 以 相应 的 自由 度 。 因 此 要 先 计算 上 述 变异 量 对 应 的 自 
由 度 ; 国 数据 样本 中 有 下 个 数据 ,所 以 总 变异 量 对 应 的 自由 度 吕方 反 下 一 1: 因 每 组 内 有 
ni 个 数据 ,所 以 组 内 变异 量 对 应 的 自由 度 为 各 组 内 变异 自由 度 的 办 加 得 df, 二 in 一 1); 
因 有 不 个 组 之 间 比 较 , 所 以 组 间 变 异 量 对 应 的 自由 度 立方 = 上 一 1。 三 个 自由 座 之 间 具 有 
相 加 性 :df 二 dF, 十 df,。 用 自由 度 去 除 对 应 的 变异 量 , 分 别 得 到 组 间 和 组 内 变异 的 均 方 


或 叫 方差 :MS, 一 了 MS, 二 了?"。 比 较 两 个 方差 的 差异 显著 性 ,要 使 用 FF 检验。 这 里 ， 





| 
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[TT Br 





TL al 


Ms, 
MS, 
公式 6-5 说 明 :F 是 一 个 方差 比率 ,其 大 小 反映 了 相对 于 被 试 间 差异 及 随机 诈 莽 造 
成 的 组 内 变异 而 言 ,组 间 变 异 的 太 小 。 如 果 FF 过 1, 说 明 组 间 变 异 不 太太 ,数据 总 变异 中 
相当 部 分 是 由 于 被 试 差异 和 测量 的 随机 误差 带 来 的 ,不 能 归 固 于 不 同 观测 条 件 ; 如果 
FE 二 1 且 下 值 落 人 了 疡 二 0.05 的 临界 区 .说明 数据 组 间 的 方差 显著 太 于 组 内 方 荤 ,有 反 鼎 本 
不 同 观测 条 件 下 测量 结果 存在 显著 性 差异 , 即 研究 者 操控 的 研究 变量 的 变化 会 导致 观测 
变量 的 明显 变化 ,二 者 有 显著 的 因果 关系 或 关联 性 . 


二 、 方 差分 析 的 适用 条 件 
一 般 来 说 ,观测 的 数据 符合 以 下 基本 假设 时 ,才能 使 用 方差 分 析 ， 


F 





C6 一 55) 


(一 ) 总 体 正 恋 分 布 

方差 分 析 与 其 他 参数 检验 方法 一 样 ,也 要 求 数据 样本 来 自 正 态 分 布 的 总 体 ， 心理 竺 
研究 中 ,大 字数 变量 的 数据 总 体 服从 正 访 分 布 ,所 以 一 般 不 需要 对 总 体 的 正 态 性 进行 术 
验 。 当 有 证 据 表 明 总 体 不 是 正 态 分 布 时 ,可 以 使 用 相应 的 非 参 数 检 验 , 也 可 以 将 数据 进 
行 革 种 变换 ,使 变换 后 的 数据 接近 正太 性 ,使 用 方差 分 析 。 


(二 ) 变异 的 可 加 性 

方差 分 析 的 逻辑 基础 是 变异 的 可 加 性 或 线性 分 解 性 , 即 可 根据 不 同 变 异 颜 将 总 变 导 
分 解 为 车 干部 分 ,这 几 个 不 同 部 分 的 变异 来 源 意 义 必 须 明 确 , 而 且 彼 此 相互 独立 。 在 一 
般 的 心理 学 研究 中 ,这 一 条 件 都 能 满足 。 示 例 6- 1 中 ,总 变异 分 解 为 组 癌变 异 和 组 内 变 
绎 两 部 分 ,组 问 变异 是 不 同 的 观测 条 件 引 起 的 ,而 组 内 变异 是 由 实验 误差 及 被 试问 的 莽 
异 引起 。 由 于 被 试 分 组 是 随机 的 ,与 实验 条 性 的 变化 没有 系统 的 关联 性 ,所 以 实验 误差 
与 被 试 莽 异 都 具有 随机 性 ,组 内 变异 与 组 间 变 异 是 相互 独 耻 的 。 


{三 ) 不 同 数据 样本 的 方 益 齐 性 

在 方差 和 分 析 中 用 MSw 作 为 总 体 组 内 方差 的 估计 值 ,而 计算 条 Sw 时 相当 于 将 各 个 实 
验 条 件 下 的 数据 样本 方差 合并 在 了 一 起 。 这 样 做 时 ,有 一 个 假设 前 提 : 各 个 处 理 组 数据 
样本 的 方差 没有 显著 性 差异 ; 即 在 统计 党 意义 上 是 相等 的 ;也 叫做 方差 齐 性 。 我 们 已 经 
指出 ,方差 分 析 的 最 重要 的 逻辑 基础 是 变异 可 加 性 ,而 变 蜡 可 加 性 要 求 组 内 变异 与 组 间 
挛 异 是 相互 独立 的 。 如 果 各 组 数据 的 方差 差异 性 较 太 时 ,在 将 各 组 数据 会 并 计算 总 的 组 
内 变异 时 .会 并 后 的 数据 变异 包含 着 与 实验 条 件 的 关联 性 , 即 不 同 实 验 处 理 下 所 和 油 数 据 
之 闻 的 变异 程度 不 同 . 由 此 造成 了 组 内 变异 与 组 间 变 异 的 关联 性 ,就 会 破坏 方 奔 分析 的 
逻辑 基础 。 

所 以 ,在 心理 学 的 实验 设计 中 ,要 保证 不 同 实验 条 忻 下 数据 样本 的 可 比 性 ,这 样 才能 
特 实 验 可 能 得 到 的 组 间 姜 异 归 因 于 实验 条 件 。 当 各 组 数据 样本 方差 不 齐 性 时 , 怠 等 于 说 
各 数据 样 订 的 分 布 特点 不 同 质 , 就 不 具有 可 比 性 ， 所 以 ,进行 方差 分 析 时 ,要 进行 方 莽 齐 
性 检验 Crest of equality of variance) ,也 叫做 方 莽 的 同 质 性 检 驻 (test of homogeneity of 


variance) 。 各 数据 样本 的 方差 不 齐 性 时 ,原则 上 就 不 能 进行 方差 分 析 了 。 
三 、 方 差分 析 的 基本 程序 


方差 分 析 的 一 般 程序 是 :变异 量 的 计算 .自由 度 的 计算 ,方差 齐 性 检验 .F 比率 及 其 
显著 人 性 水 平 的 确定 ,给 出 方差 分 析 表 。 我 们 以 例 6-1 对 应 的 表 6- 1 中 的 数据 来 调 示 方 
差分 析 的 过 程 ， 


(一 ) 变异 量 的 计算 
变异 量 即 离 差 平方 和 ,其 通用 公式 是 , SS = DX 一 上 洪 )! ,推导 后 为 ; 


法 
3 (公式 6 一 6) 
即 一 组 数据 的 离 差 平方 和 等 于 该 组 数据 的 平方 和 减 去 数据 总 和 平方 除 以 数据 个 
数 。 该 公式 既 可 用 寺 表 -1 中 所 有 18 个 数据 的 总 变异 量 计算 ,也 可 以 用 于 每 一 组 6 





个 数据 的 一 个 组 内 变异 量 的 计算 。 我 们 先 利用 1VX; 计算 出 各 组 数据 的 平方 和 及 全 部 


数据 的 平方 和 ,使 用 ( yX, ) 计算 出 各 组 6 个 数据 和 的 平方 及 全 部 18 个 数据 和 的 平 
方 ; 再 根据 公式 6-6 分 别 计算 出 三 个 组 数据 的 变异 量 28.28.24, 以 及 所 有 数据 的 总 变异 
量 332, 再 将 三 个 数据 组 内 变异 量 相 加 得 到 总 的 组 内 变异 量 80, 如 表 6 -2 所 示 。 根 据 变 
导 量 的 可 加 性 得 到 组 间 变 异 量 为 :SS,=55, 一 SS 一 332 一 80 一 252。 有 具体 计算 结果 如 表 
a 

表征 -二 不 同 沿 励 气 所 下 孝 试 的 举重 时 间 ({s) 


被 试 证 | 辣 ， 注 。 (=3) 
1 8 16 21 
Il2 11 16 
a 11 15 1 8 
4 7 1 19 
时 13 12 22 
6 9 14 18 
| 10 13 19 = 1 
G28 1042 2190 SBED 
1 
(Co mY 3600 6084 12996 63504 
『 本 十 
08 本 2 
EE SS 一 332 
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LL Bt 贡 汪 澡 


LL 河 恒 邦 邯 刁 硬 灯 慎 于 路 病 后 





(二 ) 自由 度 的 计算 

总 变异 自由 度 ;d 帮 = 二 nk 一 l=6X%3 一 ] 二 17 

每 一 组 内 变 蜡 自由 度 :n 一 1=6 一 1 二 5 

总 的 组 内 变异 自由 度 :df, 二 k(n 一 1)=3X5==15 
组 间 变 蜡 自 由 度 :d 记 = 一 1=3 一 1 二 2 


(三 ) 方差 齐 性 检验 

方差 分 析 的 基本 假设 中 ,要 求 各 组 数据 的 方差 齐 性 , 即 各 组 数据 方差 不 存在 显著 性 
差异 。 方 差分 析 中 的 方差 齐 性 检验 常用 哈 特 莱 (4Hartley) 方 涯 ,这 种 方法 先是 计算 各 个 组 
内 的 方差 ,然后 用 其 中 最 大 的 方差 除 以 最 小 的 方差 ,得 到 种 组 之 间 报 大 的 方差 比率 ， 


1 可 
Fw 一 ee 和 ee (公式 间 一 7) 


如 表 6 -2 中 显示 ,实验 条 件 4 .和 A; .A 对 应 数据 组 的 变异 量 分 别 为 28、28,24, 种 组 
数据 自由 度 均 为 5, 于 是 三 组 数据 的 均 方 即 方 差分 别 为 :5.6.5.6,4.8, 其 中 最 大 的 方差 为 
5.6. 最 小 的 方 整 为 4.8, 尼 人 公 吉 6-7 得 到 ,二 1.167, 该 FF 比率 分 子 ,分 母 的 自由 度 
均 汶 5, 数据 组 一 3。 

根据 组 数 和 各 组 内 自由 度 . 查 附 表 的"F,,, 的 临界 值 ( 输 特 药方 差 齐 性 检验 )" 表 得 
到 临界 值 Fi 二 10.8。 当 FF 二 Fowv.ow 时 ,可 认为 各 实验 处 理 的 数据 方差 没有 显著 
差异 ,方差 齐 性 成 立 。 本 例 中 F se1.167 一 Fo 一 10.8, 所 以 方差 齐 性 。 


(四 ) 下 比率 及 其 显著 性 水 平 的 确定 

在 方差 分 析 过 程 中 ,研究 者 甘心 的 是 组 间 方 盖 是 否 足 够 大 。 如 果 组 间 方 差 小 于 或 等 
于 组 内 方差 , 那 各 组 内 方差 被 看 作 是 误 莽 项 方 善 ,这 时 组 间 方 差 间 不 大 于 误差 方 盖 .说明 
实验 外 理 未 能 导致 观测 变量 的 显著 变化 ,方差 检验 无 需 进行 下 去 :如果 组 间 方 整 太 于 误 
凌 项 方差 , 则 需要 进一步 看 方差 比率 下 是 否 落 人 户 二 0 05 或 起 二 0.01 的 临界 区 。， 所 以 ， 
计算 下 比率 时 总 是 将 组 间 方 差 放 在 分 子 位 置 上 ,进行 下 值 的 单 侧 检 验 ， 

根据 已 经 计算 出 的 组 间 变 异 量 和 组 内 变异 量 . 组 间 变 异 自 由 度 和 组 内 变异 自由 度 ， 
得 到 组 间 方 差 和 组 内 方 装 ,进而 得 到 组 间 方 差 与 组 内 方差 的 比率 下 值 。 
MS, _ SS/df, _ 252/2 

MS, SS rdf,. 80/15 

本 例 中 ,FF 比率 的 分 子 自由 认为 组 间 自 由 度 2; 分 母 自由 度 为 组 内 自由 府 15, 查 附 表 
5 一 一 * 下 值 表 ( 单 侧 检验 )" 得 到 ;F6315 二 3,.68 和 Fv.in 二 6 36。 

计算 得 到 的 王 值 大 于 临界 值 Fa 所 以 组 间 差 异 非常 显著 ,显著 性 水 平 达 到 pp 二 
0.01, 说 明 三 种 实验 条 件 下 测量 得 到 的 数据 存在 很 显著 的 差异 ， 


F 








tt 


{五 ) 给 出 方差 分 析 表 ， 

上 面 的 儿 个 步 又 ,可 以 归纳 成 一 个 方差 分 析 表 。 一 般 在 实验 报告 的 结果 部 分 ,并 不 
需要 写 出 统计 检验 的 计算 过 程 ,只 需要 到 出 一 个 简明 的 方差 分 析 表 就 行 了 。 以 本 地 中 的 
方差 分 析 结 果 为 例 给 出 方差 分 析 表 的 一 般 形式 ,如 胡 6-3 所 泵 。 


表 5-3 不 同 激 励 气氛 下 被 斌 举重 时 间 比 较 的 方差 分 析 表 





挛 异 若 平方 和 ”自由 度 均 方 F 显著 性 水 平 
组 间 a52. 00 9 126. 00 ee be, 0] 
乌 内 30., O00 15 5, 94 

着 计 332., 00 17 





第 二 节 单 因 素 完全 随机 设计 的 方差 分 析 


方差 分 析 的 关键 是 变异 量 和 自由 度 的 计算 和 和 分解。 需要 注意 ,研究 设计 不 同 , 对 应 
的 数据 结构 就 会 不 同 ,变异 量 与 自由 度 的 分 解 方式 也 不 同 。 例 656-1 是 研究 一 个 变量 对 观 
测 变 量变 化 的 影响 。 研 究 变 量 的 三 个 水 平 构成 了 三 种 实验 条 件 : 所 选 被 试 随 机 分 成 三 
组 ;每 组 被 试 只 在 一 种 实验 条 件 下 接受 测试 ,这 种 研究 设计 就 叫做 完全 随机 设计 (com- 
plete rarwomalized design}, 国 为 研究 单一 变量 的 影响 ,所 以 也 叫 单 困 素 完全 随机 设计 
taingle[actor complete randomalized design? 。 这 种 设计 是 将 被 试 随机 分 组 形成 可 比 的 
相等 组 ;控制 其 他 变量 ,让 每 组 被 试 都 只 在 研究 变量 的 一 个 水 平 上 接受 测试 ;于 是 获得 不 
同 条 件 下 的 数据 组 ;数据 组 之 间 不 存在 相互 关联 性 ,所 以 该 研究 设计 也 叫 单 因素 独立 组 
实验 设计 。 如 休 数 据 存在 显著 的 组 间 差 异 , 说 明 研 究 变 量 的 不 同 水 平 会 带 来 测试 结果 的 
显著 变化 ,由 此 验证 研究 变量 与 被 测试 变量 之 间 的 因果 关系 或 相关 关系 。 这 里 需要 强调 
两 点 : 

第 一 ,完全 随机 研究 设计 ,要 求 各 被 试 组 具有 相等 性 。 这 不 是 绝对 意义 上 的 "相等 
性 ”, 而 是 相对 意义 上 .统计 学 意义 上 的 “相等 性 ”; 并 不 要 求 各 组 被 试 数 完全 相等 ,要 求 方 
差 具 有 统计 掌上 的 "相等 性 ”, 即 方差 齐 性 。 

第 二 ,完全 随机 设计 也 可 用 于 研究 不 同人 群 总 体 是 否 存 在 差异 性 的 问题 。 如 ;研究 
明 女 生 是 香 存 在 智力 差异 ; 初 一 至 高 三 的 六 个 年 级 间 的 学 生 是 否 存在 认 知 策略 水 平 的 其 
异 。 在 这 类 研究 中 ,可 建立 虚无 假设 :智力 不 存在 性 别 差 异 5 试 知 策略 不 存在 年 级 差异 等 
等 。 那 么 ,对 于 智力 测验 来 说 ,男生 样本 与 妇 生 样本 就 可 被 看 成 来 自 同一 总 体 的 两 个 样 
本 ;对 于 认 知 策略 发 展 水 平 来 说 , 初 一 到 高 三 的 六 个 样本 也 可 被 看 成 是 来 自 同一 总 体 的 
六 个 样本 。 在 碰 无 假设 下 进行 方差 分 析 . 如 果 组 间 差 异 达 到 显著 性 水 平 ,就 可 拒绝 虚无 
假设 .接受 研究 假设 ,验证 其 中 存在 的 性 别 盖 异 .年 级 差异 等 。 


一 、 单 因素 完全 随机 设计 方差 分 析 的 过 程 


前 节 就 例 6- 1 进行 的 方差 分 析 已 经 完整 地 展示 了 单 因 素 完 全 随机 设计 的 方差 分 析 
程序 ,不 过 读 例 只 是 单 因 素 完全 随机 设计 方差 分 析 适 用 条 件 中 的 一 种 , 纵 出 了 各 组 测试 
的 原始 数据 且 各 组 数据 个 数 相 等 。 研 究 中 还 会 近 到 两 种 情况 :一 其 给 出 了 各 组 原始 数据 
但 各 组 数据 个 数 不 等 ,二 是 只 给 出 了 各 组 数据 的 统计 量 ( 平 均 数 ,个案 数 ,标准 差 或 方差 
等 ) 而 来 给 出 原始 数据 。 本 节 在 总 结 单 因 素 随机 设计 方差 分 析 的 一 般 过 程 之 后 ,将 疹 出 
另 两 种 情况 的 方差 分 析 示 例 。 


LL 于 二 蜡 寺 司 半 汐 





单 因 素 完 全 随机 设计 的 一 般 数据 模式 是 :研究 变量 取 上 个 水 平 , 抽 取 组 被 试 样 本 ， 
每 组 样本 在 研究 变量 的 一 个 水 平 上 接受 测试 , 即 可 得 到 上 个 独立 的 数据 样本 ,每 个 数据 
样本 中 的 数据 个 数 分 别 记 为 zn 、ns、……* v4， 则 数据 总 个 数 NN 二 4 十 ns 十 ……。 十 玉 。 这 
时 ,方差 分 析 的 一 般 过 程 是 : 

步骤 1: 提出 研究 假设 及 , 和 虚无 假设 H。 

研究 假设 电 , :研究 变量 对 观测 变量 有 显著 影响 ,其 不 同 水 平 下 观测 的 数据 存在 组 间 
差异 。 

虚无 假设 有 H, :研究 变量 对 观测 变量 未 产生 影响 ,其 不 同 水 平 下 观测 的 数据 不 存在 显 
著 性 差异 , 故 可 看 作 来 自 于 同一 数据 总 体 的 随机 样本 。 

方差 分 析 的 后 续 程序 就 是 在 虚无 假设 成 立 的 前 提 下 进行 , 即 当 数据 出 现 一 定 的 组 间 
差异 时 ,推算 该 差异 由 抽样 误差 或 其 他 随机 误差 造成 的 概率 是 多 少 ( 即 伴随 概率 )。 

步骤 2: 计算 和 分 解 变 异 量 


总 变异 量 ， SS, = 3 


式 中 D2 是 全 部 数据 平方 的 和 、 (Bn ) 是 全 部 数据 和 的 平方 ,N= 十 
711 十 ……， 二 mm; 为 全 部 数据 个 数 或 全 部 被 试 数 ， 


组 间 变 异 量 SS, 一 51( Dx) hy Et 


式 中 ( 2X。 ) 为 第 j 组 数据 和 的 平方 n, 为 第 j 组 数据 的 个 数 或 被 试 数 。 
组 内 变异 量 : SS,=S5S,— SS, 

组 内 变异 量 SS, ,也 即 残 差 项 变异 量 。 

步骤 3: 计 算 和 分 解 自由 度 

总 变异 的 自由 度 :dj 记 三 N 一 1=(n 十 妈 十 … 十 如) 一 1( 所 有 数据 个 数 减 1) 
组 间 变 异 的 自由 度 :& 上 六 一 上 一 1( 数 据 组 数 或 被 试 组 数 减 1) 

组 内 变异 的 自由 度 :df 二 df, 一 df, 二 N 一 k( 所 有 数据 个 数 减 组 数 ) 

步骤 4: 计 算 均 方 或 方差 


LL 


组 间 均 方 或 方差 : MS,=5;=SS,/df, 

组 内 均 方 或 方差 : MS,.=S:=SS,/df. 
步骤 5: 计算 下 比率 和 确定 其 显著 性 水 平 

下 比率 ， F=MS,/MS,. = S/S? 


查 附 表 5 的 下 值 表 ( 单 侧 检验 ) 确 定 临 界 值 : Fw， Foi ，, 即 p 二 0.05 和 
pp 二 0.01 显著 性 水 平 的 下 临界 值 。 

确定 显著 性 水 平 :如 果 F<=F osc. wo* 则 p 一 0.05, 组 间 差 异 未 达到 0. 05 的 显著 性 
水 平 ; 如 果 F056 .a 二 FF 过 Fowar,.ar: 则 0.01 二 p 二 0.05, 组 间 差 异 达 到 了 0.05 显著 性 
水 平 但 未 达到 0. 01 显著 性 水 平 ;如 果 FF 二 Fa .rj , 则 p 二 0.01, 组 间 差 异 达到 了 0. 01 
显著 性 水 平 。 心 理学 研究 中 一 般 在 0.05 显著 性 水 平 上 决定 拒绝 还 是 接受 虚无 假设 。 即 
F 一 Fa 时 ,接受 虚无 假设 ,否定 研究 假设 ,认为 组 间 差 异 不 显著 ;下 二 已 wor sr ， 
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时 ,拒绝 虚无 假设 ,接受 研究 假设 ,认为 组 间 差 异 显著 。 
步 又 6: 给 出 方差 分 析 表 
将 以 上 计算 过 程 归纳 为 方差 分 析 表 的 形式 ,如 表 6 -4 所 示 。 在 撰写 研究 报告 时 ,无 
需 将 计算 过 程 一 一 写 出 ,只 将 方差 分 析 过 程 中 的 主要 计算 结果 总 结 成 方差 分 析 表 的 形式 
放 入 研究 报告 。 
表 6-4 单 因素 完全 随机 设计 的 方差 分 析 表 


i 
变异 源 。 平方 和 自由 度 。 均 方 F 
RE 
组 间 SS, | MS, MS,/ MS, 

组 内 3 NO—k NS 
会 计 S55, N 一 1 





二 、 各 组 数据 个 数 不 等 时 的 方差 分 析 过 程 
【 例 6 - 2〗 某 教师 为 了 研究 中 学 生 认 知 策略 的 发 展 变化 ,分 别 从 本 校 初 一 、 初 三 、 高 
二 年 级 随机 抽取 了 10 名 学 生 参 加 认 知 策略 水 平 测试 , 因 临时 原因 ,少数 学 生 示 能 参加 测 
试 。 测 试 结果 如 表 6 - 5 所 示 。 
表 6-5 各 组 数据 个 数 不 等 时 方差 分 析 示例 数据 表 


第 
] 3S 45 i 
2 50 65 方 
3 30 65 70 天 
分 
4 52 50 69 析 
5 15 40 75 和 
6 40 52 81 2 
7 39 48 72 
8 48 70 
9 45 62 
10 
by 3 
X 2 Xs 一 1428 
之 
去 
x 18404 18958 46400 2) 2X; =83762 
j=1 t= 


[ 解 】 计算 各 组 数据 之 和 YX, .所 有 数据 之 和 》 3》)X,、 各 组 数据 平方 和 


5S x; .所 有 数据 平方 和 3 》)X; ,并 将 这 些 结果 列 人 表 6 - 5。 方差 分 析 过 程 如 下 ， 
步骤 1; 计算 和 分 解 变异 量 











a (各 名 总 ) 1428: 

一 和 一 于 一 一 - 一 

SS， pp 83762 一 一 76 一 5331. 846 
| 上 条 
Wy) Ro 

ee 3 (2 ) (名 名 ) - (24 360? i 
i N 下 9 26 

=4143. 510 


SS 一 SS, 一 SS 一 5331. 846 一 4143. 510=1188. 337 
步骤 2: 计 算 和 分 解 自 由 度 
组 间 变 蜡 的 自由 度 df,:df,==k 一 1=2 
组 内 变异 的 自由 度 df,.:df。=df, 一 df,==N 一 k=23 
步骤 3; 计算 均 方 或 方差 
组 间 均 方 或 方差 MS, :MS,= 二 S?==SS,/df,=4143.510/2 二 2071.755 
组 内 均 方 或 方差 MS, :MS,=S:=SS,/df,=1188. 337/23 二 51. 667 
步 又 4: 计 算 下 比率 和 确定 其 显著 性 水 平 
F 比率 :FF 一 MS,/MS。 一 S!/S; 一 2071.755/51. 667 一 40. 098 
查 下 表 ( 单 侧 检 验 ) 确 定 临 界 值 :Fostur ar， 一 下 .ostz.z9 一 3. 42 Fo ur, = F0102.23) 


音 一 5. 06 
让 F(2,23) 一 40.098 二 Fwroz.z， 则 p 二 0.01, 组 间 差 异 达 到 了 很 显著 的 水 平 。 
步骤 5: 给 出 方差 分 析 表 
将 以 上 计算 过 程 总 结 为 方差 分 析 表 ,如 表 6 - 6 所 示 。 
- 表 6-6 示例 6-2 数据 的 方差 分 析 表 
明 变异 源 平方 和 自由 度 均 方 F p 
: 组 间 4143.510 2 2071. 755 40. 098 过 从 和] 
© 组 内 1188. 337 23 51. 667 

合 计 5331. 846 25 





由 表 6 -6 所 示 的 方差 分 析 结 果 显 示 ,本 例 的 中 学 生 在 认 知 策略 发 展 水 平 测试 分 数 上 
存在 显著 的 年 级 差异 。 


三 、 只 给 出 各 组 统计 量 时 的 方差 分 析 过 程 


【 例 6 -3】 有 三 组 学 生 的 人 数 分 别 为 10、15、13, 分 别 参 加 了 红 光 , 绿 光 、 黄 光 刺 激 信 
号 下 的 简单 反应 时 间 测 试 ,三 组 学 生 测试 结果 如 表 6 -7 所 示 。 试 分 析 灯 光 刺 激 的 颜色 是 


否 影响 反应 速度 。 
表 6-7 各 组 数据 个 数 不 等 时 方差 分 析 示 例 数 据 表 (反应 时 间 :ms) 
i 
统计 量 红 光 绿 光 黄 光 
平均 数 182 216 205 
标准 差 15 22 19 
人 数 10 15 13 





[ 解 】 在 这 种 无 原 姑 数据 的 情况 下 ,方差 分 析 中 的 计算 量 实际 上 大 为 戌 少 。 这 里 关 
键 要 准确 地 理解 变异 量 与 标准 兰 和 方差 的 关系 ;变异 量 除 以 自由 度 等 于 方 莽 ,上 方 莽 的 平 
方 根 即 为 标准 车。 下 边 是 此 类 资料 的 方差 分 析 过 程 。 

步 邓 1: 计算 和 分 解 自 由 度 

总 蛮 异 的 自由 度 :d 疡 三 及 一 1 一 (十 三 十 十 本 ) 一 1 天 10 十 15 十 13 一 1 一 37 

组 间 变 异 的 自由 谋 :d 了 ,二 一 1 二 2 

组 内 变异 的 自由 度 :dfs 二 df, 一 df 三 NN 一 上 二 

步 又 2: 计 算 和 分 解 变异 旺 

先 根 据 各 组 数据 个 数 和 平均 数 计算 全 部 数据 的 平均 数 和 总 和 : 

数据 总 和 ， 


YIN= Dn RK) = 10%182+15x216+13 x 205 = 7725 
ji 三 | 


a DX 2 DX 人 
总 体 平 罗 数 虑 ;二 N S 一 TGS 一 0 3 
n, 


再 计算 组 间 变 异 量 和 组 内 变异 和 其 : 
= Do 二 x? = (2 2 0 








i es 

=(10w 182:15X216: 1 206) C—O ==6993.816 第 
38 第 
A 
' J 章 
= (df X85) = YLtw— 18) 

i=| fw 
=0x15 十 14X2 二 13X19 二 1 红 对 4 
S39 = 二 SS. =6993. 816+13133=— 20126. 816 坟 
步 蛛 3: 计算 均 方 或 方才 . 
噜 


组 间 均 方 或 方 羔 ,MS,= 二 Si 二 SS,/d ff, 一 6993. 816/2 二 3496. 908 
组 内 拘 方 或 方差 :MS5,= 守 = 二 5S5, /df,=13133/35 一 375.229 
步 又 :计算 FF 比率 和 确定 其 显著 性 水 平 
比率 :F=MS,/MS, =Si/S =3496. 908/375,229=9.319 
查 玉 表 ( 单 侗 检验} 确定 临界 值 ; Fw602,35 二 3.27,F on 王 5,27 
F001 组 间 头 异 达 到 了 人 性 们 显著 性 水 平 。 
步骤 5: 给 出 方差 分 析 表 
将 以 上 计算 过 程 总 结 为 方差 分 析 表 ,如 表 6-8 也 未。 
襟 而 -8 示例 =3 数 据 的 方差 分 析 囊 





变异 汰 平方 和 自由 座 拘 市 F p 
世间 B99. B16 有 4 0 9. 319 = ,| 
证 内 1313%. 000 a 379, 2 

条 S0126. 816 3 





由 表 6 -8 所 示 的 方差 分 析 结 果 显 示 , 本 例 中 在 不 同 颜色 的 灯光 信号 刺激 下 ,学生 的 


必 各 者 昌 127 


ed 


1 


反应 时 间 存 在 显著 性 差异 。 


第 三 节 单 因 素 随机 区 组 设计 的 方差 分 析 


单 因 素 完全 随机 实验 设计 的 目的 在 于 以 组 间 差 异 的 显著 性 水 平反 映 研究 变量 对 观 
测 变 量 的 影响 ,其 方差 分 析 的 基本 方法 就 是 计算 观测 数据 的 组 间 方 差 与 组 内 方差 比率 
F,F 越 大 说 明 研 究 变 量 的 影响 越 明 显 。 显 然 , 当 组 间 变 异 确定 的 情况 下 ,下 值 的 大 小 就 
取决 于 组 内 变异 量 的 大 小 。 组 内 变异 量 越 大 ,下 就 越 小 ,组 间 变 异 就 越 有 可 能 达 不 到 显 
著 性 水 平 ,这 样 就 有 可 能 掩盖 本 来 存在 的 研究 变量 的 影响 效应 ，。 

分 析 一 下 组 内 变异 量 , 便 可 发 现 还 可 将 其 分 解 为 两 部 分 :一 部 分 是 组 内 被 试 差异 带 
来 的 数据 变异 量 ; 男 一 部 分 是 测量 过 程 中 的 随机 误差 带 来 的 变异 量 。 因 为 方差 分 析 中 下 
值 的 显著 性 水 平 是 相对 于 随机 误差 来 确定 的 .所 以 如 果 将 被 试 间 变异 混淆 在 组 内 变异 中 
就 会 降低 方差 分 析 的 敏感 性 。 那 么 如 果 仅 以 随机 误差 变异 方差 作为 下 比率 计算 的 分 母 ， 
怎样 才能 将 被 试 间 变 异 从 组 内 变异 中 分 离 出 来 呢 ? 心理 学 研究 中 经 常 采 用 的 随机 区 组 
实验 设计 和 重复 测量 实验 设计 均 可 在 一 定 程度 上 达到 这 一 目的 。 


一 、 单 因素 随机 区 组 设计 的 基本 模式 


随机 区 组 实验 设计 的 基本 方法 是 : 先 分 析 实 验 对 象 个 体 间 的 主要 差异 ,以 及 哪些 方 
面 的 差异 可 能 会 造成 他 们 在 实验 中 测量 数据 的 不 同 : 再 据 此 制定 一 定 的 标准 将 实验 对 象 
划分 为 不 同 的 区 组 ,使 得 每 个 区 组 内 被 试 的 差异 性 尽 可 能 降 到 最 小 ,区 组 内 的 被 坛 具有 
同 质 性 ;最 后 将 每 个 区 组 内 的 被 试 随 机 ,均等 地 分 配 到 各 种 实验 处 理 中 接受 测量 ， 

随机 区 组 设计 的 基本 模式 是 :有 上 个 实验 处 理 、 实 验 对 象 被 划分 为 a 个 区 组 ,其 中 每 
个 区 组 内 的 实验 对 象 数 必须 是 实验 处 理 的 整数 倍 ( 至 少 为 1 倍 , 即 至 少 保证 一 个 区 组 能 
向 每 一 实验 处 理 分 配 一 个 实验 对 象 ) ,以 便 将 每 个 区 组 中 的 实验 对 象 随机 、 均 等 地 分 配 到 
各 个 实验 处 理 中 去 。 可 以 将 其 实验 设计 模式 表示 成 表 6 -9 的 形式 (以 二 4.a 二 5 且 每 个 

表 6-9 单 因 素 随机 区 组 实验 设计 的 一 般 模式 


实验 处 理 
| 


区 组 1 Sn ly Sl Su 
Sl Slz Sls Su 
Sul Suz Ss So 
.组 2 3 
区 组 Sl Sa:z Sss Sa 
S S 2 5 号 Ss 
区 组 3 + 
Sa Sa2 Ss Ss 
Sl Sys: Sa Ss 
区 组 4 s g 
Su S12 Sa Ss 
2 总 1 3 Sss Ssa 
已 可: [A 
a St S;, 人 央 Su 


区 组 有 8 个 研究 对 象 的 情况 为 例 )。 在 这 种 实验 设计 中 ,同一 区 组 的 被 试 重复 出 现在 各 
种 实验 处 理 中 , 换 句 话说 ,就 是 在 同一 个 区 组 内 被 试 差异 得 到 了 一 定 程度 的 控制 ， 同 时 ， 
不 同 区 组 的 数据 被 区 分 开 来 ,形成 了 以 不 同 区 组 划分 的 数据 组 ,按照 前 一 节 计 算 组 回 变 
异 和 自由 度 的 方法 同样 可 以 计算 区 组 间 变 异 和 自由 度 , 从 而 将 此 部 分 变异 从 组 内 变异 中 
分 离 出 去 ,使 下 比率 计算 时 的 分 母 项 降低 ,这 时 的 分 母 项 主要 是 反映 从 总 变异 中 分 离 了 
组 间 变 异 .区 组 变异 后 残余 的 误差 变异 及 方 盖 大 小 ,所 以 此 部 分 变异 量 叫做 残 差 , 一 般 用 
S55, 表示 ,对 应 的 的 方 或 方差 用 MS. 或 3$- 表示 。 

* 随 机 区 组 设计 的 原则 是 同一 区 组 内 的 被 试 应 尽量 ' 同 质 ',……… 对 于 每 一 区 组 而 言 ， 
它 应 该 接受 全 部 实验 处 理 ; 对 于 每 种 实验 处 理 而 言 , 它 在 和 不同 的 区 组 中 重复 的 次 数 应 该 
相同 "TC 这 种 设计 是 香 能 够 控制 个 别 差 异 给 研究 带 来 的 影响 ,关键 是 区 组 划分 标准 是 否 
全 理 。 区 组 划分 变量 的 选择 和 测量 往往 存在 一 定 难 度 ,如 果 划 分 标准 不 好 ,不 仅 不 能 有 
效 地 控制 误差 ,反而 会 引入 新 的 误差 。 


二 、 单 因素 随机 区 组 设计 的 方差 分 析 过 程 


与 单 因 素 完 全 随机 设计 的 方差 分 析 过 程 相 比 , 单 因素 随机 区 组 设计 方差 分 析 过 程 中 
只 是 增加 了 区 组 问 变异 量 和 自由 庶 的 计算 ,这 样 就 可 以 从 总 变异 量 和 自由 度 中 减 去 组 间 
变异 量 和 自由 度 .区 组 变异 量 和 自由 度 之 后 得 到 残 差 项 的 变异 量 和 自由 度 。 

在 此 只 列 出 区 组 间 变 异 量 与 自由 度 的 计算 方法 。 区 组 变异 量 . 区 组 自由 度 和 均 方 等 
用 4 作为 下 标 , 可 分 别 表示 为 SS. .dd 六 .AMS. 或 52。 

设 区 组 数 为 ,每 一 区 组 内 有 个 研究 对 象 . 某 一 区 组 内 数据 的 平均 值 为 X,.* 参 照 前 
一 节 组 间 变 异 量 计算 方法 可 知 区 组 变异 量 和 自由 度 的 计算 公式 为 ; 

网 me 

式 中 ( SAYX )” 代表 某 一 区 组 内 数据 和 的 平方 :( 3) YX) 还 是 代表 全 部 数据 和 的 

平方 :N 还 是 代表 全 部 实验 对 象 数 或 全 部 数据 个 数 ， 
df.=a—1] 
于 是 残 差 项 的 变异 量 和 自由 度 计算 公式 分 别 为 ， 
53,.=S553,.— SS — 359, 
d=df—df—df=MN-—k—aTl 

[ 例 56-4] 某 教师 为 了 研究 四 种 不 同 的 写作 训练 方法 中 , 哪 种 方法 更 有 效 , 选 择 了 
36 名 高 一 学 生 。 按 照 前 一 学 期 历次 作文 成 绩 的 平均 分 数 将 36 名 学 生 划 分 为 优良 .中 等 、 
一 般 三 个 写作 水 平 ,每 个 水 平均 有 12 名 学 生 , 而 12 名 学 生 被 随机 均 分 到 各 实验 处 理 。 
经 一 学 期 的 写作 训练 后 进行 写作 能 力 测 试 ,计算 出 每 一 学 生 的 得 分 比 前 一 学 期 历次 作文 
平均 分 提高 的 分 数 。 结 果 如 家 6-10 所 示 。 

[ 解 】 下 边 以 例 6 -4 的 数据 为 例 说 明 随 机 区 组 设计 的 方差 分 析 过 程 。 和 计算 各 实 


一 张 厚 师 赤 心 理 与 盘 育 统计 学 站 ,北京 师范 志学 出 版 社 ,1588 年 版 ,第 288 页 。 


骨 汪 点 
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验 处 理 下 测试 分 数 和 .各 实验 处 理 下 测试 分 数 的 平方 和 ,各 区 组 被 试 测试 分 数 和 ,以 及 全 
主 测试 分 数 总 和 ,全 部 测试 分 数 的 平方 和 , 列 人 表 6-10。 然 后 : 


步 又 1: 计算 和 分 解 变异 量 ( 与 前 文 计 算 相似 处 就 略 些 ) 














二 466: _. 
SS 一 7506 一 一 一 1475.89 
189 | 89 | 160 | 122*) 466 
SS， (= 9 + 人 一 443. 67 
时 三 
es 
ss,= Y) (2 (XD) =- (2 1 212: | 84: s 
“| q 一 12 I 36 
甫 站 -10 司 用 例 和 -4 的 研究 数据 制 雪 (成 辣 提 高 幅度 } 
一 实验 处 理 | ， 忆 
区 地 教学 方法 1 教学 方法 2 教学 方法 3 教学 方法 4 ZX 
区 组 1: 优 庶 170 
总 区 彰 2 中 每 212 
理 
统 
计 
学 
与 
写 
F 
号 
S 
应 
用 
LJ 
者 
各 
昌 





33,.=55.—S5,—55,=1475. 89—443,67—700, 56= 322, 67 
步骤 2: 计算 和 分 解 自由 度 
总 变异 的 自由 度 :d 太 一 六 一 1 一 36 一 1 一 35 
组 间 变 异 的 自由 度 :df, 一 k 一 1 一 3 
区 组 变异 的 自由 度 ;4/. 二 4 一 1=3 一 1=2 
残 莽 项 的 自由 度 ;df, 一 df 一 df 一 df. 一 35 一 3 一 2 一 30 
步骤 3; 计算 均 方 或 方差 
组 间 均 方 或 方差 ;WMS, 一 中 一 SS,/d 旋 一 全 和 全 一 147.89 


区 组 均 方 或 方差 :MS, 一 S; 一 SS, /df, 一 一 354.78 





残 差 项 均 方 或 方差 :AMS 一旦 一 S9 .了 一 二 Yr =10.,76 


步骤 4; 计算 下 比率 和 确定 其 显著 性 水 平 
比率， 











EF 0 
FE, —— NS ANIS Ne ie 一 1 7. 8 一 ] 于 ， 了 韦 

I0. 76 

a 二 
一 一 -一 一 EE = 
F.=MS, /MS,= Ss ., jo 76 时 志和 


查 下 表单 侧 检 验 ) 确 定 临界 值 ;:F or03.sm 二 2.92,F.os.am 二 和 .51 
让 ==13.74> 记 oram rF, 二 32.97 这 Fsam ': 均 达到 pp 二 0.01, 差 异 很 显 着 。 
步 双 5; 给 出 方差 分 析 表 
将 以 上 计算 结果 总 结 为 方差 分 析 表 ,如 表 6-11 所 示 。 
甫 56-11 示例 -4 数据 的 方差 分 析 囊 


CC 





恋 异 笨 平方 和 自由 度 均 六 F 让 
组 间 4. 6 3 147.89 13. 74 =, 01 
区 组 TO09, 56 2 965d. 78 92 97 一 站 ,01 
殉 鞭 322, 87 3 ] 必 .节省 

育 计 1475, 8&4 35 





方差 分 析 的 结果 显示 ,不 同 的 写作 训练 方法 引起 的 写作 成 绩 提 高 幅度 有 非常 显著 性 
的 差异 。 结 合 表 6-10 中 的 数据 可 知 , 第 三 种 训练 方法 的 效果 最 好 。 方 差分 析 的 结果 同 
时 显示 ,区 组 变量 对 测量 结果 具有 显著 影响 ， 

不 过 ,就 研究 目的 来 说 ,区 组 变量 的 影响 是否 显著 都 没有 直接 意义 ,但 在 方差 分 析 表 
中 最 好 还 是 给 出 其 检验 的 结果 , 它 可 以 显示 是 否 有 必要 采用 区 组 设计 。 当 区 组 变 基 的 效 
应 显著 时 ,说 明 区 组 差异 确实 会 带 来 测量 结果 的 变异 。 如 果 不 对 研究 对 象 进行 区 组 划分 
而 直接 采取 随机 分 组 ,这些 变 异 就 和 随机 误差 引起 的 变异 温 请 在 一 起 ,方差 分 析 的 敏感 
性 会 下 隆 ,所 以 采取 区 组 设计 是 非常 必要 和 有 实际 意义 的 ;如 果 区 组 效应 不 显著 ,说 明 区 
组 间 差 异 并 不 明显 ,这 可 能 是 区 组 划分 不 成 功 或 研究 对 象 本 身 就 具有 较 高 的 同 质 性 造成 
的 ,区 组 设计 可 能 是 不 必要 的 ， 


三 、 单 因素 重复 测量 实验 设计 的 方差 分 析 


张 厚 紧 曾 将 单 因 素 重复 测量 实验 设计 看 作 是 单 因 素 随 机 区 组 实验 设计 中 的 一 个 特 
例 , 即 一 个 研究 对 象 就 是 一 个 区 组 ,或 者 说 每 个 区 组 中 只 有 一 个 研究 对 象 , 而 这 一 个 研究 
对 象 要 在 所 有 实验 处 理 下 接受 测量 得 到 若干 组 数据 由， 朱 阐 先生 也 链 同 这 种 看 法 ”， 但 
是 , 舒 华 将 单 因素 重复 测量 实验 设计 看 作 是 独立 于 区 组 设计 的 一 类 设计 ,我 赞同 舒 华 的 
处 理 方式 ,因为 重复 测量 实验 设计 有 其 自身 特点 ;与 随机 区 组 设计 有 本 质 不 同 。 不过， 
这 种 实验 设计 的 数据 模式 和 方差 分 析 过 程 与 单 因素 随机 区 组 实验 设计 是 一 致 的 ,所 以 在 
本 节 中 吕 对 其 加 以 简单 解释 ,并 以 孙 例 6 -5 来 说 明之 ,- 

重复 抽 量 实验 设计 frepeated measuredesign) 也 叫做 组 肉 设计 (within-group design) 
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或 被 试 肉 设计 (withinrsubjeets design) ,是 把 抽取 来 的 所 有 被 试 作为 一 组 ,接受 所 有 实验 
处 理 。 这 种 宣 验 设计 在 控制 杆 试 个 体 差 异 对 研究 影响 方面 , 比 随机 区 组 设计 更 有 效 ,而 
且 节 省 实验 被 试 .是 当前 心理 学 研究 中 常用 的 设计 类 型 ， 当 然 , 这 种 实验 设计 也 存在 问 
题 ,主要 是 一 种 实验 条 件 下 的 操作 会 影响 后 续 操 作 , 即 容易 出 现 系 列 效应 (series efleet)， 
为 了 解决 系列 效应 问题 ,实验 顺序 的 安排 上 要 采用 抵 请 平衡 方法 。 我 们 以 示例 6-5 来 说 
明 单 因素 重复 测量 实验 设计 的 基本 模式 和 方差 分 析 过 程 ， 

【 例 6-5] 某 研究 者 想 通 过 实验 证 实 继 勒 错觉 并 同时 研究 箭头 张 开 角 度 对 错觉 最 
的 肿 响 ,于 是 抽取 了 10 名 大 学 生 , 每 个 学 生 都 先后 用 长 度 估 计 测 量 器 测 基 长 度 估计 误差 
做 ,用 摆 勒 错觉 仅 测 量 箭头 角度 分 别 为 15 ,45 .75 时 的 长 度 估计 误差 和 量 。 结 果 如 表 
6-12 所 示 。 在 实验 操作 上 ,要 特别 注意 采用 平衡 法 请 除 系 列 效应 的 影响 。 该 实验 设计 
中 ,被 试 人 数 w 二 10. 实 验 处 理 数 上 =4， 

于 4-13 发 度 居 计 误差 量 的 比较 [mm] 











被 试 | 长 度 舍 计 误 错觉 位 118 铺 瘦 们 15” 忻 觉 习 75" pe 
r= 
| 6 1 和 4 
2 | Io 14 5 30 
i 3 2 8 8 7 25 
二 | 3 il ? 9 30 
i 5 ls 12 lo al 
学 : 
与 6 到 1 9 11 32 
下 7 3 12 11 下 35 
8 2 11 6 了 26 
9 1 前 0 “是 虽 
Fry 
用 | 可 2 加 二 甩 30 
| 0 
于 y 用 i ~ 
: x | 加 110 3 mm | X= 
ps BB 1276 1037 176 DD 077 


【 解 】 下 边 以 表 6-12 的 数据 为 例 说 明 单 因素 重复 实验 设计 的 方差 分 析 过 程 ， 该 过 
种 与 单 因 素 随 机 区 组 设计 的 方差 分 析 几 乎 一 致 ,只 是 时 将 上 述 的 区 组 变异 改 为 被 试 间 蛮 
律 ,因为 被 试 常用 subjeet 表示 ,所 以 我 们 用 S 作为 被 试 间 变异 基 , 自 由 讼 , 均 方 等 概念 表 
汞 条 屿 的 下 标 以 与 区 组 设计 相 区 别 , 另外 ,因为 这 一 实验 设计 评 叫做 被 试 内 设计 ,数据 
组 之 间 的 差 蛋 是 属于 签 试 内 的 差异 ,其 对 应 的 变异 贡 , 自 由 度 , 均 方 等 概念 表示 符号 的 下 
标 用 w 表示 , 即 被 试 菇 异 对 耕 的 统计 量 用 下 标 s 表示 .数据 组 间 的 差异 统计 基 用 如 表示 ，、 
残 差 项 的 统计 量 用 = 表示。 

拷 计算 各 实验 处 理 下 测试 分 数 和 ,各 实验 处 理 下 测试 分 数 的 平方 和 ,各 被 试 在 所 有 
实 驳 条件 下 测试 分 整 的 总 和 以 及 全 部 测试 分 数 总 和 ,全 部 油 试 分 数 的 平方 和 ,计算 刍 果 
列 人 表 6-12， 然 后: 

步 对 1: 计算 和 分 解 变异 量 


i 


315- 





与 与 ， 一 3077 一 -0 一 077— 2480. 625=596, 375 
,TH 0 ,BOY S16 

S30w™ a 10 "10 3 二 区 1 )- 0 — 17.045 
ee 人 30\_315 _ 
ss,= (于 二 | 一 1 一 87.125 


SS 一 SS 一 3S3 一 99, 一 596. 375 一 417.075 一 B7.125 一 92.175 
步骤 >: 计算 和 分 解 自 由 度 
总 变异 的 自由 度 :4 用 一 六 一 1 一 和 一 1 一 39 
的 和 
被 试 间 变 异 的 自由 度 :df,==n 一 1 一 10 一 1=9 
歼 莽 项 的 自由 度 :df,=df ,一 dfs 一 dj 一 39 一 3 一 9 二 27 





步骤 3; 计算 均 方 或 方差 
i a 7075 
被 试 内 均 方 或 方差 :MS,。 一 S; 一 SS, /df 一 一 一 一 139.025 
残 闫 项 均 方 或 方差 :M5,== 守 = 二 SS,/d/. 3 414 
步 胎 ;计算 下 比率 和 确定 其 显著 性 水 平 
玉 比 率 ;F,= 二 MS,/MS, 一 S/S:= a 一 40.722 








查 下 表 ( 单 便 检验 7 确定 临界 值 :Fiaaon 三 2.96、F.me.ar 二 4. 人 0 有 
FF 一 40.722 二 Fisans 达 到 pp 之 0.01 显著 性 水 平 。 剖 
步骤 5: 给 出 方差 分 析 表 方 
将 以 上 计算 结果 总 结 为 方差 分 析 表 ,如 表 6 -13 所 示 ， 分 
TE TT : 

变异 痢 平方 和 自由 度 淘 方 F p : 

被 试 由 417.075 i 139. 025 0 = 1 

被 试 间 87, 125 9 9. 68 

残 蔓 92.175 27 .414 

请 计 BG. 37 0 





方 郑 分 析 结 果 显 示 ,被 试 在 不 同 条 件 下 长 度 居 计 误差 具有 非常 显著 性 的 差异 ,结合 
表 6-12 中 的 数据 可 知 ,直接 估计 线段 长 度 的 误差 平均 为 2. 6mm' 而 在 使 用 剖 勒 错觉 仪 
日 第 头骨 度 为 15" .45" .75? 条 件 下 长 度 估计 误差 分 别 为 11. 0mm.9. 9mm、8. 0mm. 验 证 了 
法 勤 错觉 的 存在 ， 


第 四 节 多 因素 完全 随机 设计 的 方差 分 析 


多 因素 实验 设计 中 多 个 因素 的 多 水 平 结合 ,构成 多 个 实验 处 理 , 其 实验 处 理 数 等 于 
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所 有 自 变量 的 水 平 数 之 积 。 例 如 ,二 因素 二 水 平实 验 , 就 是 有 两 个 研究 变量 ,每 个 变量 有 
两 个 水 平 ,结合 形成 的 实验 处 理 数 就 是 2X2 一 4, 这 种 实验 设计 被 称 为 2 基 2 实验 设计 :如 
果 有 三 个 研究 变量 ,其 中 两 个 有 2 水 平 ,第 三 个 有 3 水 平 , 则 这 种 实验 设计 有 2X2X3= 
12 个 实验 处 理 , 实 验 设计 叫做 2XxX2X%3 实 验 设 计 。 名 因素 实验 中 ,如 果 将 抽取 来 的 被 试 
随机 分 为 若干 组 ,而 每 组 被 试 只 独立 地 接受 一 个 实验 处 理 下 的 测 基 ,这 种 实验 褒 计 就 叫 
做 才 因 素 完 全 随机 实验 设计 (multi-factor randomized experimental design)}。 也 就 是 说 ， 
在 多 因素 完全 随机 实验 设计 中 ,有 多 少 种 实验 处 理 ,就 要 将 被 试 随机 分 为 多 少 组 。 

现在 ,我 们 以 一 个 假想 的 实验 研究 为 例 来 说 明寺 因素 完全 随机 实验 设计 的 模式 。 

【 例 6-61 假设 某 研究 者 想 考 察 甸 台 - 菜 伊 尔 错觉 (MillerLyer illusion) 受 稍 尖 方 
间 和 和 角度 的 影响 ， 研 究 中 观测 被 试 对 长 度 佑 计 的 误差 量 时 考虑 了 两 个 研究 变量 ,一 个 是 
第 类 方向 (标记 为 上 ) ,分 为 向 外 CA1} 和 向 内 GAhs32 个 水 平 : 另 一 个 是 箭头 前 度 5 标 记 为 
月 )， 设 轻 为 15 (也 )、45 (Bi) 75(〈B3)3 个 水 平 这 是 一 个 2X3 实 验 设 计 ,， 构 成 了 6 种 
实验 处 理 。 研 究 者 愉 革 去 学 文学 院 标 科 二 年 级 学 生 中 随机 抽取 了 30 名 男生 ,再 将 这 30 
名 男生 随机 分 成 相等 的 5 组， 每 组 5 人 ,每 一 被 试 组 接受 一 种 实验 处 理 ， 所 以 ,这 是 一 
个 二 因素 完全 随机 实验 设计 。 假 设 其 实验 得 到 了 表 6- 14 的 数据 ,方差 分 析 如 何 进行 呢 ? 

表 6-14 倒 症 -后 的 实验 数据 囊 





2 


先 计算 各 组 数据 和 ;各 组 数据 的 平方 和 ,以 及 全 部 数据 的 总 和 ;全 部 数据 的 平方 和 ， 
到 入 甫 6-14。 分 析 表 6-14 中 的 数据 站 构 : 和 参加 实验 的 被 试 数 是 30 人 .所 以 表 中 数据 
总 个 数 是 30。 这 些 数据 的 变异 者 是 由 哪些 因素 引起 的 呢 ? 很 明显 ,一 .错觉 仪 的 箭头 方 
向 上 有 两 种 情况 , 即 箭 头 朝 内 和 箭头 朝 外 。 访 变量 的 变化 将 则 数据 分 为 两 大 组 。 如 果 该 
变量 变化 对 测试 结果 有 影响 ,会 导致 这 两 大 组 数据 间 出 现 一 定 的 差异 量 , 根 据 前 述 的 组 
间 变 异 量 计算 方法 ,可 以 算出 箭头 方向 点 改变 带 来 的 数据 变异 和 量 。 二 .错觉 侈 的 角度 品 
有 15 .45 和 75 三 个 术 平 。 该 变量 变化 将 数据 分 为 三 大 组 。 如果 该 变量 变化 对 利 试 结 
果 有 影响 ,会 导致 这 三 大 组 数据 间 出 现 一 定 的 差异 量 , 亦 可 接 组 间 变 异 量 计算 方法 算出 。 
三 , 当 第 类 方向 和 角度 同时 发 生疏 变 时 ,数据 被 分 为 六 组 。 而 六 组 数据 间 的 变异 其 同样 
可 以 采用 组 问 变 异 量 的 计算 方法 ， 

很 明星, 上述 两 组 数据 间 的 变异 量 是 变量 4 单独 变化 所 引 超 :三 组 数据 问 的 变异 量 
是 变量 B 单独 变 化 所 引起 ;六 组 数据 间 的 变异 晤 是 两 个 变量 同时 变化 所 引起 。 其 中 ,六 


组 数据 间 变 异 量 包 侣 了 由 单独 变化 所 引起 的 变异 量 . 刀 单独 变化 所 引起 的 变异 量 以 及 
站 .B 两 个 变化 相互 作用 引起 的 变异 量 。 变 量 单独 变化 引起 的 数据 变化 ,叫做 变量 的 主 效 
店 tmain effectyi 二 者 相互 作用 引起 的 数据 变化 ,叫做 变 互 效应 (Cinteractionmeffeety 可 以 
用 站 XB 表示。 

简 而 言 之 , 表 中 数据 的 变异 量 可 以 分 解 为 A 的 主 效 应 .B 的 主 效 应 ,AX%B 变 也 效应 、 
残 差 四 个 部 分 。 在 下 述 统计 量 的 计算 中 ,为 方便 区 分 ,分 别 用 符号 A、B、.AB 和 上 作为 与 
四 个 变异 源 对 应 的 统计 重 的 下 标 。 现 就 示例 6-6 的 数据 说 明 多 因素 完全 随机 实验 设计 
的 方差 分 析 过 程 。 

步骤 1 计算 和 分 解 变异 量 


总 恋 异 量 .SS 一 2059 一 283 一 2959 一 2669. 633 一 289. 367 


30 
总 的 主 效应 变异 量 : 
i FY 
ss | 6 十 46 十 32) + a ne 
15 Is 

B 的 主 效应 变异 量 ， 

,0 _ FC56+64): (46 二 60): ，(32 十 25) 2 二 

SS 一 | 一 + I= 2 一 218.867 


起 和 8B 同时 变化 带 来 的 变异 量 ， 


ssua= [中 二 入 十 加 -十 由 和 -十 全 -十 一 2 一 249.767 
站 与 B 交互 作用 引起 的 变异 基 ; A 
S34 =5344— S35, SIs=249, 767—7. 500—218, 867 =23. 400 守 
号 号 一 S59,— SS sg = 289, 367— 249. 767= 39, 600 差 
步骤 2: 计 算 和 分 解 自由 度 
总 变异 的 自由 度 ;:df/=N 一 1] 二 30 一 1 二 29 和 
变量 A 主 效应 的 自由 度 :dfn=a 一 1=2 一 1 二 1 . 


变量 BB 主 效应 的 自由 度 :dfs 一 4 一 1 一 3 一 1=2 

站 和 B 交互 效应 的 自由 度 ;dfw 一 (a 一 1)(b 一 1)= 二 1 X22 

残 差 项 的 自由 麻 :dfi=dj 一 df 一 dfa 一 df/ 一 29 一 1 一 2 一 2 一 24 
步骤 3: 计 算 均 方 或 方差 


变量 B 主 效 应 的 方差 :MSs 二 Ss et 
变量 A 和 8B 交互 敲 应 方差 :MS 二 Sap di 


残 差 项 的 方差 , MSE 二 SE 二 SSr/d fe 一 2 1 65 
步骤 4: 计算 和 


变量 A 主 效应 方差 与 残 差 项 方差 比率 ;FA 一 NS 一 3 一 让 让 一 人 545 











变量 B 主 效应 方差 与 残 差 项 方差 比率 :Fy 一 3 一 S 一 站 一 66. 324 


\ 轩 
变量 A 和 变量 B 交互 效应 方差 与 残 差 项 方差 比率 ; Fw 一 也 一 二 是 一 二 计 一 








i 1,65 
7.091 
查 正 雪 ( 单 侧 屏 验 ] 下 on 一生 2 本 6 
根据 自由 上 席 选 用 对 应 临界 值 作 比 较 ; Fwwso 三 FFs 寺 Faeor Fs 六 Faas 
Rs 
站 的 主 效 应 达到 0.05 显著 性 水 平 ;B 的 主 效 应 ,A 与 8B 的 交互 效应 均 达 到 0.01 最 著 
性 水 平 。 


步骤 5: 给 出 方差 分 析 表 
将 以 上 计算 结果 总 结 为 方差 分 析 表 #6--15， 
囊 5=15 例 56=6 数据 的 方差 分 析 囊 
变异 源 平方 和 自由 度 二 而 F 思 


点 的 主 效 应 7,590 | 了 S00 站 , 恒 半 号 < 和 .D5 
如 的 主 效 应 S218. S67 a DD 全 ,站 呈 红 6 避 2 < 小, 站] 
站 与 BB 的 变 互 效应 23. 400 2 11. 700 7., O91 < 人 .日 
理 残 莫 39. FOO 24 1. 65 
洛 计 289. 367 29 
方 盖 分 析 蝴 果 显 示 ,被 试 的 锣 勤 错觉 量 受 到 和 荫 头 方 向 的 显著 影响 .受到 箭头 角度 非 
常 显著 的 影响 , 简 头 方向 与 箭头 角度 对 错觉 量 的 影响 具有 非常 显著 的 变 互 效应 。 


S 虽然 例 6-6 是 一 个 简单 的 多 因素 完全 随机 设计 ,但 它 能 够 说 明 完全 随机 设计 的 所 有 

十“ 特征 ,包括 如 何 评估 研究 变量 的 主 效 应 和 交互 效应 。 如 果 遇 到 自 变量 或 自 变量 的 水 平 数 

s 更 多 的 实验 设计 ,其 实验 的 原理 和 数据 分 析 的 程序 都 与 该 例 所 展示 的 过 程 相 似 。 比 如 ， 

s ”对 于 2X3X2X4 完 全 随机 实验 设计 来 说 ,其 自 变量 是 4 个 ,实验 处 理 数 是 48 ,那么 实验 
怠 需 机 48 组 被 试 。 在 数据 分 析 中 ,需要 分 析 四 个 自 变 量 的 主 效应 ;两 两 变量 间 的 交互 效 
应 ,三 个 变量 间 的 变 互 效应 .四 个 变量 间 的 交互 效应 等 ,这 里 需要 考察 的 交互 效应 就 达 11 
个 。 显然 , 随 者 研究 变量 数 及 变 其 水 平 煞 的 增加 ,所 需要 的 被 试 组 数 也 随 之 增加 ,并 带 来 
方差 分 析 计 算 量 的 迅速 增加 ,也 就 越 来 越 依赖 于 SPSS 等 统计 分 析 软 件 。 


第 五 节 方差 分 析 中 效应 的 进一步 分 析 


一 、 各 平均 数 间 的 多 重 比较 


| 一 般 来 说 ; 方 磊 分 析 的 主要 目的 是 通过 下 检验 考察 组 间 变 异 在 数据 总 变异 中 起 作用 
| “的 太 小 ,借以 对 两 组 以 上 数据 的 平均 数 进行 差异 检验 ,从 而 得 到 一 个 整体 性 的 检验 结果 。 

如 果 下 检验 的 结果 没有 达到 显著 性 水 平 , 说 明 实验 中 的 研究 变量 对 观测 变量 没有 显著 丸 
咱 ,检验 就 此 结束 。 但 是 如 果 下 检验 的 结果 达到 了 显著 性 的 水 平 , 却 还 要 对 多 个 平均 数 
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做 进一步 的 两 两 比较 ,以 确定 究竟 是 哪些 数据 组 之 问 的 平均 数 差 异 显著 ,哪些 数据 组 之 
间 的 平均 数 差 异 不 显著 ,这 在 方差 分 析 中 被 称 为 事后 多 重 比 较 (post multi-comparison)。 
FF 检验 达到 显著 性 水 平 ,只 表明 几 个 实验 处 理 的 两 两 比较 中 至 少 有 一 对 平均 数 间 的 差异 
达到 了 显著 性 水 平 , 不 代表 所 有 平均 数 的 两 两 比较 都 差异 显著 ,所 以 需要 进一步 地 具体 
分 析 。 

如 何 比 较 呢 ”按照 :检验 的 方法 ,平均 数 的 两 两 比较 可 以 直接 使 用 1 检验 ,但 这 只 通 
各 于 两 个 样本 之 间 的 比较 。 当 出 现 三 个 以 上 的 样本 时 ,就 不 适 台 于 直接 使 用 上 检验 了 。 
什么 原因 呢 ? 比如 ,两 个 独立 样本 人 数 各 为 10 人 人 ,其 平均 数 盖 异性 + 检验 时 的 自由 度 为 
18, 对 应 于 0.05 显著 性 水 平 的 临界 值 ，ss= 一 2 101。 那 就 是 说 :如 果 这 两 个 样本 是 来 自 
于 同一 总 体 的 两 个 随机 样本 ,二 者 平均 数 差 异性 检验 时 上 值 绝 对 值 大 于 2. 101 的 概率 是 
小 于 0.05 的 ,属于 小 概率 事件 。 可 是 如 果 出 现 了 三 个 10 人 的 样本 两 两 比较 , 则 需要 3 次 
平均 数 盖 异性 的 上 检验 ， 那 就 相当 于 同样 的 过 程 连 续 进 行 3 次 , 且 每 一 次 从 同一 总 体 中 
随机 抽取 两 个 样本 ,其 平均 数 差异 性 1 检验 时 ,i 值 大 于 2. 101 的 概率 都 小 于 0.05。 这 样 
一 来 ,+ 值 大 于 2.101 的 概率 就 是 小 于 3X0.05=0. 15。 简 单 地 说 ,如 果 样 本 平均 数 差异 : 
检验 连续 进行 三 次 的 话 , 能 得 到 1 二 2. 101 的 概率 是 小 于 0. 15, 但 0.15 并 不 属于 小 概率 ， 
这 也 是 为 什么 三 个 以 上 样本 平均 数 差 异性 检验 时 不 能 直接 使 用 两 两 之 间 的 上 检验 的 
理由 。 

所 以 , 磋 到 这 种 情况 ,就 需要 使 用 过 重 比较 方法 上 。 才 重 比较 方法 有 多 种 . 本 书 只 
介绍 其 中 一 种 常用 的 简便 方法 , 叫 履 N 一 KK 法 :是 由 Newman 和 Keul 提出 来 的 一 种 方 
法 ,也 叫做 9 检验 法 ， 其 具体 的 步骤 是 : 

(1) 将 要 比较 的 各 个 平均 数 从 小 到 大 作 等 级 排列 。 

(2) 根据 比较 等 级 r 和 和 自由 度 dfr 或 df ,+, 查 "g 分 布 的 临界 值 " 表 得 到 gw; 或 gm 
其 中 比较 等 级 r 就 是 两 个 相互 比较 的 平均 数 排列 等 级 之 差 加 1;dfe 或 df 是 方差 分 析 
中 残 差 项 的 自由 度 ( 一 般 的 表示 符号 有 是 djs ,但 在 完全 随机 实验 设计 中 也 把 误差 项 变异 
叫做 被 试 内 变异 ;所 以 也 可 用 df, 表示 )。 

C3) 计算 样本 平均 数 的 标准 误 :SEx 一 
其 中 MS# 是 组 内 均 方 (完全 随机 设计 时 应 用 MS,) ,n 为 样本 容量 。 
完全 随机 设计 中 车 各 组 容量 不 同 , 则 标准 误 ;SEx 一 汪汪) 

其 中 wm 分 别 民 表 两 个 样本 的 容量 。 

(4) 标准 误 乘 以 4 的 临界 值 (qgo.os XSEs 或 goo 关 SEx) 就 是 对 应 于 某 一 比较 等 级 
的 两 个 平均 数 相 比较 时 的 临界 值 。 如 果 丙 个 平均 数 的 差异 基 太 于 gins 关 SEx， 则 达到 
0.05 显著 性 水 平 ; 如 果 两 个 平均 数 的 差异 量 大 于 gw X 半 SEx， 则 达到 9.01 显著 性 水 平 。 

在 例 6-5 中 ,A.B.C.D 四 种 条 忻 下 测 得 结果 的 平均 数 分 别 为 4。 二 2,6,%s 二 11,0， 
一 9.9, 久 二 8.0; 样 本 容量 为 n= 二 101 方 差分 析 中 MSE 二 3, 414.dfr 二 27, 试 对 种 组 平 
均 数 进行 包 重 比较 ， 

步骤 1: 对 各 个 样本 平均 数 进行 排序 

等 级: 1 2 3 4 
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平均 数 i 天 ，。 Re 成 

步骤 2: 根 据 比较 等 级 "和 dr 查 “9 分 布 的 临界 值 ” 
表 中 没有 自由 度 27 对 应 的 9g 临界 值 , 查 最 接近 的 自由 度 24 的 g 临界 值 。 因 为 只 有 

四 个 平均 数 比 较 , 所 以 最 大 的 +=4。 得 到 : AS 

站 9 
r 一 3 一 一 .53 qv—=4,54 
六 一 4 一 go 一 3.90 gw =4.91 
步骤 3: 计 算 平 均 数 的 标准 误 








Sm) 
步 又 4: 计 算 与 + 对 应 的 平均 数 差 异 量 的 临界 什 
r=2—rg ns SEs=2.92%0.584=1,705 gum XSEr=3.96%0,584=2,313 
r—3rqgu wm x SEs—2.53%0, 584—=1,478 guo XSEs=4,54X0, 584=2,651 
r 一 4 和 hmXSEY 一 3.90X0.584 一 2.278 gn XSEs=4.91X0.584—2.867 
步 又 5: 把 四 个 平均 数 两 两 之 间 的 差异 与 相应 的 临界 值 比较 

表 6-16， 方差 分 析 中 多 重 比较 的 结果 


平均 数 二 时 咱 = 0 天 -一 遇 9 Rs=11.0 


R= i 
Kd. ee 1:9 
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表 中 数据 是 相应 两 个 平均 数 的 差异 量 。* 表示 达到 0.05 显著 性 水 平 ; **# 表示 达到 
0.01 显著 性 水 平 :未 标 星 号 则 表示 来 达到 显著 性 水 平 。 


二 、 主 效应 与 变 互 效 应 


(一 ) 什么 是 主 效应 与 交互 效应 

前 文 已 有 介绍 ,在 一 项 条 因 素 实 验 研 究 中 ,只 考虑 某 一 变量 单独 变化 所 引起 观测 变 
量 的 变化 叫做 主 效应。 在 方差 分 析 的 计算 方法 上 , 主 效应 的 考察 是 在 该 变量 的 各 个 不 同 
水 平 下 ,将 所 有 对 应 的 观测 数据 平均 ,再 比较 这 些 水 平 下 平均 数 的 差异 显著 性 。 比 如 在 2 . 
(有 4， 和 AA; 两 个 水 平 ) XxX2( 有 B 和 Bs 两 个 水 平 ) 的 实验 研究 中 ,观测 得 到 四 组 数据 ,分 
别 对 应 于 六 .Bi ,AiBs ,AiBi、AsB; 四 种 实验 条 件 。 也 就 是 说 ,在 六 条件 下 有 4 Bi、 
4i 阳 。 两 列 数据 ,将 这 两 列 数据 加 在 一 起 计算 平均 数 得 到 A, 水 平 下 的 平均 数 ; 在 A 条 件 
下 有 AsB, .A;Bs 两 列 数据 ,同样 方法 得 到 入, 条 人 忻 下 的 平均 数 ,这 两 个 平均 数 之 间 的 莽 
异 就 是 变量 A 的 主 效应 。A 的 主 效应 是 在 根本 不 考虑 数据 在 B, ,B; 是 如 何 变化 的 情况 
下 得 到 的 ,或 者 是 在 假设 一 个 变量 的 效应 独立 于 另 一 个 变量 的 情况 下 得 到 的 。 类 似 地 ， 
也 可 以 得 到 变量 B 的 主 效应 ， 

但 实际 上 ,这 种 假设 在 许多 时 候 是 不 成 立 的 ,会 出 现 一 个 变 基 的 效应 因 另 一 个 变 莉 
的 不 同 水 平 而 不 同 。 比 方 说 ,有 两 种 药片 4 和 A; 均 可 治疗 革 种 心血 管 疾 病 ,但 是 这 两 
种 药物 的 疗 北 可 能 会 与 用 药剂 量 有 关 ; 在 用 量 B,( 每 日 服用 3 次 每 次 2 片 ) 的 情况 下 ,A 


疗效 非常 明显 .A; 的 疗效 微弱 ,但 是 在 用 量 B, (每 日 服用 3 次 ,每 次 4 片 ) 的 情况 下 ,A 
疗效 很 差 且 出 现 了 轻微 中 毒 迹 象 .A; 的 疗效 很 
好 。 这 就 出 现 了 一 个 变量 的 效应 依赖 于 另 一 个 
变量 的 情况 ,这 就 叫 交 互 效 应 。 这 里 的 例子 表示 
成 图 6- 1 的 形式 ,能 更 直观 地 说 明 交 互 效应 。 
可 将 变 互 效应 的 内 涵 和 概括 为 一 句 话 :两 个 变量 的 
作用 存在 相互 依赖 性 , 即 一 个 变量 的 效应 因为 一 
个 变量 的 水 平 不 同 而 不 同 。 
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(二 ) 主 效 庶 与 交互 效应 的 关联 性 上 

方差 分 析 直 接 给 出 变量 的 主 效应 和 交互 效 “时” ， 谈 量 A 与 袜 量 日 交 冰 认 和 
应 是 否 显著 的 结果 ,多数 研 究 者 也 据 此 判定 变量 的 作用 是 理 明 显 以 及 这 些 变量 的 作用 
是 否 相 互 依 下 。 事 实 上 ,变量 的 主 效应 与 交互 效应 的 评估 并 非 这 么 简单 ,它们 存在 着 关 
联 性 ,需要 具体 分 析 。 我 们 以 两 个 变量 的 主 效应 和 交互 效应 为 例 来 分 析 。 当 交互 效应 
不 显著 的 时 候 , 两 个 变量 相互 独立 , 可 以 直接 从 其 主 效应 是 否 显著 来 评估 其 对 观测 变 
量 的 作用 大 小 ; 当 两 个 变量 交互 效应 显著 时 , 就 不 能 简单 地 从 主 效应 是 理 显 著 的 结果 
中 直接 得 出 结论 了 。 现 以 交互 效应 显著 为 前 担 , 来 区 分 变量 A 的 主 效应 是 否 显著 的 三 
种 情况 。 

如 图 6 一 2 所 示 ,我 们 分 三 种 情况 来 讨论 : 

第 一 ,图 中 a 图 所 示 , 交 互 效应 显著 ,A 的 主 效应 也 显著 。 而 且 在 B, 和 B, 两 种 条 件 
下 ,平均 数 从 条 件 Al 到 条 件 A, 的 变化 方向 基本 一 致 ,只 是 变化 幅度 有 所 不 同 。 在 Bi 水 
平 上 ,平均 数 从 A, 到 A 的 下 降幅 度 大 ,在 B; 水 平 上 ,下 降幅 度 小 。 这 里 的 交互 效应 捷 
羡 了 自 变量 全 在 自 变量 B 不 同 水 平 上 的 效应 量 的 差异 性 。 很 明显 ,在 Bi, 水 平 上 ,A 的 效 
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应 量 大 于 其 在 B, 水 平 上 的 效应 量 。 

第 二 ,图 中 心 e 图 所 示 , 交 互 效应 显著 ,4 的 主 效应 也 显著 。 这 时 上 的 效应 方向 可 能 
会 被 变 互 效应 重 曲 ， 在 占 图 中 ,4 的 变化 在 BB, 的 水 平 上 引起 了 观测 数据 的 显著 变化 ,但 
在 BB 水 平 上 却 未 引起 变化 。 这 就 是 说 ,4A 的 变化 不 是 在 任何 情况 下 都 会 引起 测量 数据 
变化 的 , 它 依 粘 于 自 变量 号 的 水 平 。 在 c 图 中 ,虽然 名 的 变化 在 B 的 两 个 水 平 上 都 引起 
六 测量 数据 的 明显 变化 ,但 是 变化 的 方向 正好 相反 。 从 其 主 效 应 看 ,A 的 水 平 提高 可 以 
促进 因 变 量 分 数 的 提高 ,但 实际 情况 是 : 当 4 在 Bi 水 平 上 提高 时 ,反而 会 导致 因 变 量 分 
数 的 下 降 。 所 以 在 这 种 情况 下 ,显著 的 交互 效应 掩盖 或 焉 曲 了 自 变量 A 的 作用 机 制 : 它 
在 BB 的 不 同 水 平 上 效应 量 是 不 同 的 ,有 时 甚至 正好 相反 ， 

第 三 ,图 中 de、 图 所 示 , 交 互 效 应 显著 ,A 的 主 效应 却 不 显著 。 实 际 上 ,交互 效应 
掩盖 了 上 的 效应 。 从 这 些 图 中 可 以 明显 看 到 A 的 效应 ,但 方差 分 析 结 果 却 会 显示 A 的 
二 效应 不 显著 ,这 是 因为 A 在 B 的 两 个 水 平 上 的 效应 方向 相反 ,计算 A 的 主 效 应 时 A， 
和 A; 的 差异 量 被 掩盖 在 了 观测 数据 平均 的 过 程 中 。 

那么 ,如 何 依据 变量 主 效应 及 该 变量 与 其 他 变量 的 交互 效应 来 进行 结果 分 析 呢 ? 
很 简单 :方差 分 析 早 果 显 示 A 的 主 效应 及 A 与 其 他 变量 的 交互 效应 都 不 显著 时 ;意味 
着 从 的 效应 真 的 不 明显 ,方差 分 析 的 结果 显示 A 的 主 效应 不 显著 但 A 与 其 他 变量 的 
交互 效应 显著 时 ,意味 着 A 其 实 是 对 测量 结果 有 明显 作用 的 , 即 4 的 效应 其 实 是 存在 
的 , 具 不 过 因为 其 效应 的 夫 小 和 方向 依赖 于 其 他 变量 ,所 以 会 因 其 他 变量 的 水 平 不 同 
而 不 同 。 

上 述 分 析 提醒 我 们 :在 方差 分 析 结果 中 ,如果 因子 间 的 交互 效应 达到 了 显著 性 水 平 。 
那么 变量 的 效应 有 可 能 会 被 焉 曲 或 拓 盖 。 也 就 是 说 :不 能 简单 地 依据 其 主 效应 是 否 显著 
来 判断 它 是 否 对 测量 变量 有 影响 ,而 要 进行 简单 效应 检验 ,分 别 考察 其 在 其 他 恋 量 不 同 
水 平 上 的 变化 情况 。 理 则 ,可 能 会 得 到 错误 结论 。 

总 之 ,交互 效应 可 能 会 掩盖 或 牌 曲 两 个 因子 中 任何 一 个 因子 的 主 效应 。 因 此 ,只 要 
是 交互 效应 达到 了 统计 学 上 的 显著 性 水 平 在 就 主 效应 问题 作出 结论 前 都 要 仔细 考察 具 
体 的 数据 变化 ,0 


三 、 简 单 效 应 检验 


在 上 述 分 析 中 发 现 : 包 因素 实验 中 ,一 个 变量 的 效应 在 男 一 个 变量 的 不 同 水 平 上 
可 能 会 有 不 同 的 表现 。 因 此 当 方 差分 析 结 果 中 出 现 了 变量 间 的 交互 效应 时 ,往往 需要 
进行 简单 效应 检验 , 即 分 别 在 一 个 变量 的 不 同 术 平 上 ,检验 男 一 个 变量 不 同 水平 间 是 
否 带 来 测量 数据 的 显著 性 差异 。 比 如 ,在 包含 变量 A 和 8B 的 二 因素 二 水 平 研究 中 ,如 
果 两 个 变量 的 交互 效应 显著 ,那么 研究 者 不 仅 需 要 在 A, ,A; 的 水 平 上 分 别 检验 已 .B， 
茶 件 下 测试 数据 的 差异 性 ,还 需要 在 B、B, 的 水 平 上 分 别 检 验 A .A, 条 件 下 测试 数据 

阐 单 效应 检验 的 逻辑 也 很 简单 。 如 果 要 检验 在 一 个 变量 的 一 个 水 平 上 , 另 一 个 变 呈 
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不 同 水 平 间 测试 数据 是 否 存 在 显著 性 差异 ,就 要 上 先 计算 在 这 一 局 部 的 数据 的 组 间 变 异 
量 . 自 由 度 及 方差 ;然后 以 此 方差 除 以 前 述 方差 分 析 中 计算 出 来 的 残 差 项 方差 得 到 下 比 
率 , 判 断 其 显著 性 水 平 。 

仍 以 例 6-5 的 实验 数据 来 说 明 简 单 效 应 检验 的 基本 过 程 。 由 第 四 节 中 例 6-6 数据 
的 方差 分 析 表 即 表 6- 15 已 经 知道 , 残 差 项 方差 MSE 二 对 二 1.65, 对 应 的 自由 度 df 二 
24。 设 变量 A 的 水 平 用 j 表示 ,ij 一 1,2; 变 量 B 的 水 平 用 r 表示 ,r 二 1,2、3。 

将 表 6-14 的 数据 汇总 简化 成 表 6- 17 的 形式 ,因为 该 表 是 对 包含 六,B 两 个 变量 的 
空 验 数据 进行 单元 内 全 并 得 到 的 ,所 以 也 叫做 AB 表 。 
表 f-17 示例 656-6 实验 数据 简单 效应 检验 的 AB 表 
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根据 组 间 变 异 量 、 自 由 庶 和 均 方 计算 方法 ,计算 得 到 ， 
加 2 


(Dx) (>, Xr) 


56* , 64 120* _ 时 
ee 
这 一] 一] :所 以 得 到 方差 :MS rank 平 5 二 6 二 总 

同样 方法 可 计算 得 到 : 


轩 Th DB 
号 守 届 在 硕 过 平 ) = 所 2 一 人 一 19 0d Fra =2—] 三 1 ,MSnrgmks! =189. 60 





SE 并 1 一 


yy [a 至 
与 全 i 在 国术 平 1 一 人 号 2 一 年。 90 .ad fn Has 一 之 一 1 一 1] + 在 gg 末 军 ， 三 44, 90 


LL 当 宇 朵 斗 贡 沾 吕 


下 户 起 
字号 i 在 A 来 衬 = 中 + 给 十 对 一 4- 一 58. 13， 
dyna; =3—1=2MSpenkr = 29. oF 
旦 a 2 时 
SSienke — 十 -1 全 -一 -一 555 G0, 
dd fpiaas =3—1=2 ,MS Eank 站 On 
以 上 述 方 差 除 以 残 差 项 方差 即 可 得 到 对 应 的 下 比率 : 
Fg 村) = 3. 8791 Fnackq4; = 11. 879, Fmkft) = 2. 970 
Fivemik 和 ee = 17. G184 PpaastTF! = 168, 455 
查 下 表 ( 单 侧 栓 验 ) ,得 ; Foisw 二 4, 26,F ia 二 717. 2， Fizw = .40 PF oriaiy = 
5,.6] 
将 计算 的 F 比率 与 查 表 所 得 临界 值 比较 可 知 ,在 B; 水 平 上 ;变革 A 的 变化 对 观测 变 
量 产 生 了 非常 显著 的 效应 ,在 B 和 B; 水 平 上 ,变量 A 的 效应 均 不 显著 ;在 Al 和 A; 水 
平 上 ,变量 B 都 表现 出 对 观测 变量 极其 显著 的 影响 ， 





第 六 节 方差 分 析 的 SPSS 过 程 


利用 SPSS 软件 完成 方差 分 析 , 先 要 建立 正确 的 数据 文件 。 通 常 ,在 因素 型 实验 研究 
中 存在 三 类 变量 :研究 者 操纵 的 变量 ,被 试 的 机 体 变 基 、 观 测 变量 (往往 就 是 因 变 量 )}。 其 
中 研究 者 操纵 的 变量 又 分 组 间 设 计 的 变量 和 组 内 设计 的 变量 。 组 间 变 量 的 不 同 水 平 对 
应 于 不 同 的 被 试 组 ,所 以 某 种 意义 上 ,组 间 设 计 的 变量 也 是 被 试 的 分 组 变量 ;组 内 变量 则 
是 定义 了 每 一 被 试 均 要 接受 的 不 同 实 验 处 理 , 该 类 变量 不 构成 被 试 的 分 组 变量 ,在 数据 
表 中 以 不 同 的 观测 数据 列 体现 。 

以 前 述 的 示例 来 说 明 利 用 SPSS 软件 进行 方差 分 析 的 一 般 过 程 : 建 立正 确 的 数据 文件 ; 
选择 正确 的 方差 分 析 类 型 :对 话 框 的 结构 与 变量 配置 .功能 设置 ;结果 的 输出 与 选择 等 。 


一 、 单 因素 完全 随机 设计 的 方差 分 析 SPSS 过 程 


这 种 方差 分 析 的 过 程 是 以 ONEWAY 方差 分 析 命 令 打开 对 话 框 的 。 以 本 章 中 的 例 
6 一 1 实验 设计 模式 和 数据 来 说 明 这 一 分 析 过 程 : 

步 桑 1: 建立 正确 的 SPSS 数据 文件 

由 题 意 可 知 ,参加 实验 的 有 18 名 被 试 , 即 共 有 个 案 N= 二 18, 所 以 数据 文件 占 18 行 。 
这 里 有 一 个 自 变 量 , 分 三 个 水 平 。 也 就 把 被 试 分 成 了 三 个 组 ,用 “group" 作 为 该 变量 的 变 
其 名 ,其 取 值 分 别 为 1.2.3; 男 一 个 变量 为 观测 变量 , 即 被 试 举重 的 时 间 ， time" 作 为 其 
变量 名 ,其 数据 见 表 一 1。 

步骤 2; 单 击 菜单 *Analyze”" 选 择 "Compare Means" 中 的 "One-Way ANOVA" 打 开 单 
因素 完全 随机 实验 设计 资料 方差 分 析 的 主 对 话 框 ,如 图 6-3 所 示 。 将 因 变 量 *time" 恬 入 
“Dependent List" 下 面 的 方 框 中 ,将 自 变 量 "group" 置 入 Factor 下 面 的 小 方 框 中 ， 


TT YT ee 





图 后 =3 Dne-Way Anova 的 主 对 请 炬 


步骤 2: 设 置 多 重 比 较 
当 目 变 基 的 水 平 数 超过 2 时 ,需要 在 方差 分 析 之 后 输出 多 重 比较 的 结果 。 本 例 中 自 
变量 水 平 数 是 3, 需 要 设置 多 重 比较 ,方法 是 ; 单 击 对 话 杠 上 的 "Post Hoc…" 技 钮 打开 一 


个 对 话 框 ,对 话 框 上 有 很 凶 名 重 比 较 方法 的 选项 ,最 常用 的 是 *LSD”"。 所 以 ， 勾 选 "LSD” 
1 重量 者 帮 . 


对 点 的 复 选 框 , 单 击 “Continue" 返 回 主 对 话 框 ， 

步骤 3; 要求 方 莹 分 析 程 序 输出 样本 数据 的 描述 统计 量 . 方 盖 齐 性 检验 . 因 变 量 随 着 
自 变 量变 化 的 线 图 等 

单 击 对 话 框 上 的 “Options…” 按 钮 打开 对 话 框 ,如 图 6-4 所 示 , 可 以 勾 选 的 常用 项 目 
有 :Deseriptive" :输出 样本 数据 的 一 些 常见 描述 性 统计 量 ; Homogenelty af Variance 
test” ,输出 证 差 齐 性 检验 的 结果 ”Means plot" ,输出 因 变 量 随 自 变量 变化 的 线 图 。 设置 
好 之 后 ,点 击 “Continue” 返 回 主 对 话 框 ， 


kp 
下 
"Pw 


可 





园 百 -4 One-Way Anowva 的 设置 对 订 模 


步 又 4; 执 行程 序 , 输 出 结业 

单 击 主 对 话 框 上 的 “OK" 按 钮 ,系统 输出 所 需要 的 方差 分 析 结 果 。 单 因素 完全 随机 
设计 的 方差 分 析 ,一 般 需 要 的 或 常见 输出 结果 主要 有 五 个 部 分 组 成 : 

51) 样本 数据 的 基本 统计 量 。 主 要 有 各 个 数据 样本 的 平均 数 ,标准 差 ,标准 误 , 置 信 
区 间 等 ， 

(2) 方差 齐 性 检验 。 如 下 表 , 本 例 方 差 齐 性 成 立 ， 


囊 看 -1 呈 Test of Homogeneity of Variances: TIME 
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(3) 方差 分 析 表 。 以 表 6- 19 的 形式 输出 方差 分 析 结 果 ; 访 表 由 变异 源 , 平 方 和 
(Sum of Squares) ,自由 度 , 均 方 (Mean Square),F 比率 .显著 性 水 平 或 伴随 概率 (Sig, )。 
于 例 中 的 下 =23. 625 ,显著 性 水 平 p==0.000<0, 001, 达 到 极其 显著 的 水 平 ， 


甫 看 -19 ANOVA:TIME 











Sum of Squares di Mean Souare F Sig: 
Berween (Groups 252. O00 名 126. O00 生 0G 
Within Groups 80, DON 15 ， 生生 
Tatal 3 DOQ lr 
LL 


LL 
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4) 多重 比 较 。 以 表 6-20 的 形式 输出 事后 多 重 比较 的 结果 ,由 该 表 可 得 知 ， 
表 6-20 Multiple Comparisons: Dependemt Variable: TIME(LSD ) 





Mean Difference Sid, Errmor Sig, 95% Confidence Interval 

COGROUP CGROUP ol- Lower Bound Upper Bound 
1. 00 2 0 —3. D000 1. 333433 .D40 .8419 —, 1581 

3. 00 -9 D000D 1. 33333 DON 一 外 1 8419 二 

2. 0 1,.690 2, N00 ll: 33333 ,O40 .15B] 5 时 ]19 

2. 00 — 6, 0000 1.43343 ,000 “8. B419 4. ]581] 

3. 站 1 bo ,0000 1].33333 ,O00 8. 1581 11. 攻 4419 

2. 00 6 O000 .9343334 ,O00 3. [| 县 , 吕 4]1 9 

如 各 样本 两 两 之 间 的 差异 量 是 否 达 到 了 显著 

18 性 水 平等 信息 。 本 例 中 ,三 个 数据 样本 两 两 

之 间 的 差异 均 达 到 了 显著 或 极其 显著 的 

水 平 。 

(5) 因 变 量 与 自 变量 之 间 美 系 的 线 图 ， 
a 输出 如 图 5--5 所 示 的 线 图 , 它 反 上 映 了 随 着 
sn 自 变量 水 平 的 变化 ,相应 的 各 个 因 变 量 数据 
°F 组 的 平均 数 的 变化 情况 。 本 例 中 ,由 图 6 -5 
i a 300 看 出 ,对 应 于 实验 条 件 1.2.3 的 因 变 量 值 越 

图 6-5 One-Way Anova 杭 出 的 线 力 来 越 高 , 即 举重 的 时 间 越 来 越 长 ， 


二 、 单 因素 重复 测量 设计 的 方差 分 析 SPSS 过 程 


以 本 章 中 例 6 -5 的 实验 模式 和 数据 为 例 来 说 明 单 因素 重复 测量 设计 的 方差 分 析 
SPSS 过 程 ， 

步 最 1 :建立 正确 的 SPSS 数据 文件 

由 题 意 可 知 , 参 加 实验 的 有 10 名 被 试 , 即 共有 个 案 N=10, 所 以 数据 文件 占 10 行 。 
这 里 有 一 个 自 变量 ,分 四 个 水 平 , 但 这 个 变量 未 形成 被 试 的 分 组 变量 ,因为 自 变量 四 个 水 
平 下 的 测量 全 部 由 一 组 被 试 完成 ,所 以 这 一 数据 文件 乎 需 要 被 试 的 分 组 变量 。 因 为 被 试 
在 四 种 条 件 下 均 接 受 测试 ,得 到 了 四 列 数据 ,反映 的 是 不 同 条 件 下 被 试 长 度 估计 误差 ,所 
以 分 别 用 errorl ,error2 ,error3 .errord 作为 变量 名 以 记录 四 列 数 据 , 其 数据 见 表 6-12， 

步 耿 2: 打 开 对 话 框 

单 击 药 单 “Analyze" 选 择 "“General Linear Model” 中 的 “Repeated Measures*…"” 打 开 
重复 测量 因素 的 方差 分 析 的 主 对 话 框 , 在 这 个 对 话 框 上 设置 重复 测量 的 自 变 量 政 其 水 
二 ,以 及 各 水 平 对 应 的 因 变 量变 量 名 。 在 对 话 框 上 ”Within-Subject Factor Name:" 之 后 
的 方 框 中 输入 一 个 自 变 量 名 ,比如 "A”, 热 后 在 “Number of Levels:" 之 后 的 方 框 中 输 估 
日 变量 水 平 数 , 本 例 中 输 人 4。 然后 单 击 “Add”, 将 自 变量 及 其 水 平 置 人 到 对 话 框 上 的 大 
方 枚 中 。 再 单 击 " Define” 按 钮 打开 对 话 框 , 以 便 将 各 列 因 变量 值 与 自 变量 的 水 平 对 应 。 
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步骤 3: 单 击 *Plots…” 按 钮 ,要 求 输出 自 变 量 与 因 变 量 的 关系 线 图 

在 打开 的 对 话 框 上 ,选择 自 变 量 , 本 例 中 为 变量 “a" ,将 其 置 人 “Horizontal 和 Axis: 下 
面 的 方 框 中 ;接着 单 击 该 对 话 框 上 的 “Add"; 单 击 “Continue "返回 主 对 话 框 。 

步骤 4; 单 击 主 对 话 框 上 的 “Options" 打 开 对 话 框 ,设置 有 关 统 计量 .效应 量 检验 输出 
要 求 

选中 对 话 框 上 的 “Deseriptive Statistics" 和 ”Eastimates of effect size” ,然后 单 击 "Con- 
tinue "返回 主 对 话 框 。 

步 又 5: 单 击 主 对 话 框 上 的 "OOK" 按钮 输出 结果 

本 例 中 输出 的 结果 主要 有 以 下 几 部 分 ， 

(1) 措 述 性 统计 分 析 结 果 。 纵 出 各 个 数据 样本 的 平均 数 ,标准 差 。 

(2) 方差 分 析 表 。 输 出 如 表 6 -21 所 示 的 表格 ,该 表 中 关于 自 变 量 A 和 误差 项 的 变 
异 量 计算 .自由 度 . 均 方 等 都 有 四 行 , 是 采用 四 种 不 同 算法 的 结果 ,这 些 算 法 具有 相同 或 
相近 的 效果 ,可 取 其 一 .一般 选择 第 一 种 算 
法 (Sphericity Assumed) 得 到 的 结果 , 即 本 例 
中 方差 分 析 的 结果 是 ; 自 变 量 引 起 的 变 蜡 平方 


Estimaied Marginal Means of MEASURE 1 


总 





ss 





和 为 417.075, 自 由 度 为 3, 均 方 为 139. 025,F 和 
=40.723, 达 到 了 极其 显著 的 水 平 (p 二 0.000 三 
=0.001), EB 
(3) 自 变 量 与 因 变量 的 关系 线 图 。 本 例 了 
中 ,如 图 6-6 所 示 , 在 自 变量 的 四 个 水 平 下 ， 时 
第 一 个 水 平 ( 线 段 长 度 估计 ) 的 误差 量 最 低 、 
第 二 水 平 的 ( 继 勒 错觉 仪 的 张 开 角 度 15 度 ) 误 人 
差 量 最 大 。 
囊 看 = 了 1 Tests of Within-Subjects Effects 
SOUurce Sum of Squares di Mean Stuare - F Sig,. 
A Sphericity Assumed 十 上 了. 自卫 139., 025 ee .O00 
Greenhouse-Gelsser 417. 075 .399 0 59 Ge . DOO 
Huynbh-Feldi 1?; O75 pe 62. 261 二 个 .了 吕 弛 :DAI0 
Lower- bwund 引 17, 75 1. G00 a 0. 72 ,QOD 
ErrortAY Sphericity Assumed 92,.175 B? 33, 441 间 
Greenhouse-Gelsser 92 175 ?7.995 5 122 
Huynbh-Feldt 92, 175 23., 134 3 生 BB 


Lower-bound 92. 175 9, O00 1 242 





三 、 多 因素 完全 随机 设计 方差 分 析 的 SPSS 过 程 

以 本 章 中 例 6-6 的 实验 模式 和 数据 为 例 来 说 明 包 因素 完全 随机 设计 的 方差 分 析 
SPSS 过 程 。 

步骤 1; 建 立正 确 的 SPSS 数据 文件 
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由 题 意 可 知 ,参加 实验 的 有 30 省 被 试 , 即 共 有 个 案 和 N= 二 30, 所 以 数据 交 忻 占 30 行 。 
这 里 有 两 个 自 变 量 , 分 别 有 2.3 个 水 平 , 均 为 组 间 设 计 的 变量 ,所 以 也 称 为 分 组 变量 。 被 
试 分 成 2x3=6 个 组 ,所 以 在 数据 文件 中 要 和 包 合 这 两 个 自 变 量 , 分 别 定义 为 A.B。A 为 
衫 头 方 向 ;人 劳 向 外 ,向 内 ,分 别 用 1.2 代表 ;了 为 箭头 张 开 的 角度 ,分 别 有 15" .45" 和 75" 三 
个 水 平 ,分 别 记 为 1.2.3。 因 变量 为 长 度 估计 误差 ,用 error 标记 。 数 据 见 表 6 一 14， 

步 又 2; 打 开 主 对 话 框 

单 击 菜 单 *Analyze” ,选择 "General Linear Model” 中 的 "Univariate…", 打 开 儿 因素 
完全 随机 设计 方差 分 析 的 主 对 话 框 ;将 
变量 列表 中 的 error 笑 入 “Dependent 
Variable" 下 的 方 框 中 ;将 a,.b 置 A"*Fixed 
Factors" 下 的 方 框 申 ,如 图 565-7 所 示 。 

步 又 3: 描述 性 统计 分 析 与 方差 齐 性 
检验 

单 击 主 对 话 框 上 的 "Options… "打开 
对 话 框 , 勾 选 对 话 框 上 的 “Deseriptive 
Statistics” 和 ”Homogeneity tests” 两 项 ， 
输出 各 样本 数据 的 基本 描述 性 统计 量 和 
方差 齐 性 检验 结果 ; 单 击 "Continue" 按 向 
返回 主 对 话 框 。 

步 陵 4: 事 后 才 重 比较 设置 

_ “对 于 自 变 量 达到 三 个 以 上 水 平 的 ,一 般 可 以 在 方差 分 析 过 程 中 同时 进行 多 重 比较 。 

具体 设置 方法 是 ; 单 击 对 话 杠 上 的 "Post Hoe…" 按 钮 打开 相应 的 对 话 框 ,和 将 要 进行 儿 重 
比较 的 自 变 量 置 人 到 "Post Hoc Tests for:" 下 面 的 方 框 中 ,本 例 中 同时 旬 选 对 话 框 上 的 
“1SD" 项 ,然后 单 击 “Continue" 按 人 钮 返回 主 对 话 框 。 

步骤 5: 设 置 制作 变量 的 交互 作用 图 

因为 是 名 因 素 实验 设计 ,为 了 直观 地 表达 变量 之 间 的 交互 作用 甘 系 ,可 以 设置 制作 
更 互 作用 图 。 杯 例 中 ,可 以 制作 自 变 量 a 与 b 的 交互 必用 图 。 设置 方法 是 ; 单 击 主 对 话 
框 上 的 "Plots… "按钮 打开 相应 的 对 话 框 , 特 avb 两 个 自 变 量 分 别 置 估 “Separate Lines”、 
“Horizontal Aaxis" 下 的 方 框 中 , 单 击 "Add" 将 "b sa" 置信 “Plots" 下 的 方 框 中 。 然 后 单 
击 “Continue" 按 钮 返回 主 对 话 框 。 
步 又 65; 单 击 主 对 话 框 上 "OK" 按 钮 输出 分 析 结 果 
输出 的 结果 主要 有 以 下 儿 个 部 分 : 
41) 摘 述 性 统计 分 析 针 果 - 缩 出 种 个 数据 样本 的 平均 数 . 标 淮 瘟 . 
(2) 方差 齐 性 检验 。 如 表 6 -22 本 例 显示 内 差 齐 性 成 立 。 


表 6-22 Levene'’s Test of Equality 





图 音 ~7 癌 国 素 完 全 戎 帆 设 计 方 差 芬 析 主 对 话 框 








f Error Variances 


G30 互 了 
(3) 方差 分 析 结果 。 输 出 的 方差 分 析 结果 主要 包括 所 有 


= 






节 的 主 逆 应 和 交互 效 


应 。 本 例 方 差分 析 的 结果 如 表 6-23 所 示 。 由 表 可 知 ; 自 变量 A, 自 变量 B 的 主 效应 ,以 
及 二 者 的 交互 效应 均 达 到 了 显著 性 的 水 平 CFA 一 4. 545, 思 二 0.043; Fs 二 66. 323, 思 二 
0.0004F,. ,二 7.091,p 二 0,004) ,说 明 稍 头 方向 .箭头 人 角度 都 会 对 继 勒 错觉 量 产生 显著 影 
昨 , 上 且 这 些 影 响 具 有 交 互 性 ， 


甫 看 -33 Tests of Between-Subjects Effects 


Source Type TI Sum of Squares df Mean Square F Sig. 
A 7 300 ] 7, 509 出 。 二 本 ,中 
B 218. 867 中 |09. #33 BB 3 .CAo 
真 共 县 上 2 记 , 直 D0 B 11. 700 ?7.09 : D0 
Error 39. 600 2 1. 650 
Total 2959, 000 30 


Corrected Total 2 29 

(4) 事后 才 重 比较 。 本 例 自 变量 日 有 三 个 水 平 , 事 后 多 重 比较 的 结果 显示 ,三 水 平 
的 两 两 之 间 均 有 显著 性 差异 。 

(5) 自 变 量 的 交互 效应 图 ， 根据 交互 作 用 图 的 交叉 是 否 明 显 判 断 两 个 自 变 量 对 因 
变量 的 影响 是 香 具 有 交互 性 ， 


pa ie Marginal Means of ERROR 
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到 中 一 二 二 厂 习 思考 与 练习 题 二 jp 
1. 方差 分 析 的 基本 原理 是 什么 ?其 适用 条 人 忻 主 要 有 哪些 ? 
2, 方差 分 析 的 基本 步 队 有 哪些? 
3. 何谓 刻 重 比较 .简单 效应 检验 ? 
4. 如何 理解 主 误 应 和 变 互 效应 ,以 及 二 者 的 关联 性 ? 
5， 某 研究 者 想 考察 纪 勒 - 莱 仇 尔 错 觉 受 箭头 方向 和 箭头 角度 的 影响 ， 研究 中 的 自 变 
量 有 两 个 :一 个 是 箭头 方向 ! 另 一 个 是 箭头 角度 ,构成 了 4 种 实验 处 理 , 如 表 6--2 引 所 示 。 
研究 者 从 某 大 学 文学 院 本 科 二 年 级 学 生 中 随机 抽取 了 20 名 男生 ;再 将 这 20 名 男生 随机 
分 成 相等 的 四 组 ,每 组 5 人 ;每 一 被 试 组 接受 一 种 实验 处 理 。 假设 其 实验 得 到 了 表 6- 24 
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的 影响 有 无 交互 性 ， : 
囊 6- 24 箭头 方向 与 角度 对 错觉 重 的 影响 
箭头 方向 向 外 (Ai 第 头 方向 向 内 (As) 
箭头 角 15 度 (B,) ”箭头 角 45 度 (B:) 箭头 角 15 度 (B,) 箭头 角 45 度 (B) 





站 4 名 7 
5 3 ? 6 
7 5 9 了 
丰 4 上 下 
了 9 县 





第 七 章 相关 分 析 
(Gases 


相关 技术 是 大 批量 调研 数据 分 析 中 最 常用 和 最 核心 的 技术 之 一 。 它 通过 分 析 不 同 
变量 间 的 共 变 关系 来 发 现 变 量 间 的 内 在 关联 性 ,进而 分 析 变 量 间 关系 的 性 质 、 建 立 预 测 
关系 和 寻求 公共 因子 ,这 些 也 是 对 研究 对 象 及 测量 指标 进行 分 类 的 基础 。 本 章 在 阐明 相 
关 概 念 的 本 质 之 后 ,分 析 了 线性 相关 的 性 质 ,详细 介绍 了 积 差 相 关 、 等 级 相关 、 偏 相关 分 
析 的 基本 原理 .适用 条 件 、 一 般 步 骤 以 及 SPSS 系统 完成 上 述 相关 分 析 的 过 程 。 


宇宙 间 的 事物 总 是 相互 联系 .纷繁 复杂 的 ,反映 到 行为 科学 研究 中 ,就 是 变量 值 之 间 
会 存在 诸多 共 变 或 因果 的 关系 。 心 理学 实验 研究 中 ,经 常 采 用 的 方法 是 :操纵 一 个 或 多 
个 自 变量 的 变化 ,同时 观测 因 变 量 的 变化 。 这 是 研究 心理 活动 中 因果 关系 的 主要 技术 。 
而 在 采用 心理 测量 方法 进行 研究 时 ,数据 分 析 中 使 用 最 多 的 却 是 相关 技术 , 即 从 测量 项 
目 数据 的 共 变 关系 中 探究 人 的 心理 或 行为 结构 的 奥秘 。 比 如 ,人 们 有 时 会 说 ,“ 这 个 孩子 
个 子 越 来 越 高 ,人 也 变 得 更 懂事 了 ”。 很 显然 “个 子 高 低 " 与 * 越 来 越 懂事 "之 间 具 有 某 种 
数据 上 的 一 致 性 ,但 二 者 不 是 因果 关系 ,只 能 算得 上 是 相关 关系 。 统 计 学 上 ,研究 这 种 数 
量 上 共 变 关系 的 技术 就 叫做 相关 分 析 (correlation)。 相 关 分 析 的 种 类 很 多 ,本 章 以 线性 
相关 为 主 。 


第 一 节 相关 的 概念 


一 、 相 关 概 念 的 提出 窟 2 


“相关 ”概念 最 早 来 自 于 生物 统计 学 ,其 提出 首先 归功 于 英国 的 遗传 学 家 高 尔 顿 
(Galton) 及 其 弟子 皮尔 逊 (Pearson) :高 尔 顿 提 出 了 “相关 "概念 后 ,皮尔 进 完成 了 积 差 算 
法 的 建立 。 高 尔 顿 和 皮尔 逊 在 进行 遗传 学 研究 中 "系统 考察 了 许多 家 庭 中 父亲 与 长 子 的 
身高 关系 :研究 的 样本 是 家 庭 ,研究 中 的 两 个 变量 分 别 是 父亲 的 身高 和 儿子 的 身高 。 在 
对 样本 进行 测 基 的 过 程 中 ,得 到 一 组 天 然 成 对 的 数据 。 在 对 这 些 数据 进行 分 析 和 描述 
时 ,他 们 发 现 这 对 变量 的 取 值 一 同 起 伏 波动 ,表明 两 者 之 间 具 有 较 强 的 联系 ,从 而 导致 
“相关 ”概念 的 提出 和 “相关 ”技术 的 发 展 。 

相关 就 是 考察 两 组 观测 值 之 间 联 系 的 强度 ,而 这 两 组 观测 值 ,必须 来 自 对 同一 总 体 
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或 同一 样本 的 测量 。 比 如 ,在 学 校 中 ,对 学 生 进 行 智力 测验 和 学 业 成 绩 测量 ,可 以 发 现 智 
力 水 平 与 学 业 成 绩 具 有 一 定 程 度 的 联系 。 一 般 来 说 ,智力 水 平 很 低 的 学 生 ,存在 学 业 困 
难 , 成 绩 较 差 ;智力 水 平 较 商 者 ,学 业 成 绩 也 好 一 些 , 这 种 关系 就 是 相关 关系 。 

再 举 一 个 具体 的 例子 : 某 一 位 发 展 心理 学 家 ,积累 了 很 多 从 幼儿 园 到 大 学 各 种 年 龄 
层次 学 生 的 资料 。 这 些 资 料 既 包括 生理 发 育 数据 ,也 包括 心理 发 展 数据 ,比如 身高 、 体 
重 、 生 理 健 康 水 平 ,智力 水 平 ` 认 知 策略 水 平 ,心理 健康 水 平等 等 。 如 果 只 将 学 生 的 身高 
和 智力 水 平 ( 即 完成 智力 题 的 题 数 和 得 分 等 ) 数 据 分 别 挑选 出 来 进行 分 析 , 那 么 ,你 可 能 
会 发 现 身 高 与 智力 水 平 之 间 具 有 某 种 共 变 关系 ,这 种 关系 就 是 相关 关系 。 

由 此 看 来 ,相关 关系 与 因果 关系 不 同 。 相 关 的 两 个 变量 之 间 可 能 具有 因果 关系 ,也 
可 能 不 存在 因果 关系 。 就 拿 上 述 这 个 例子 来 说 ,身高 显然 不 是 智力 水 平 的 因 或 果 , 它 只 
是 与 智力 水 平 有 相关 关系 而 已 。 具 有 相关 关系 的 两 个 变量 之 间 存 在 两 种 可 能 关系 中 的 
一 种 :一 种 是 因果 关系 , 即 一 个 为 因 , 男 一 个 为 果 , 因 发 生 了 变化 , 果 自 然 也 就 随 之 改变 ， 
表现 出 共 变 关系 ; 另 一 种 是 共 因 关系 , 即 两 个 变量 的 变化 是 同一 个 潜在 的 原因 引起 的 , 那 
个 潜在 的 因 在 变 , 这 两 个 果 自 然 都 随 之 改变 ,所 以 也 会 表现 出 共 变 关系 。 上 述 的 身高 与 
智力 水 平 存在 的 就 是 第 二 种 关系 , 均 以 个 体 的 成 熟 为 因 。 个 体 在 成 熟 过 程 中 ,个 子 越 来 
越 高 ,智力 水 平 也 越 来 越 高 。 这 就 出 现 了 身高 与 智力 水 平 之 间 的 相关 关系 即 共 变 关 系 。 
所 以 ,在 使 用 相关 分 析 的 过 程 中 , 切 不 可 简单 地 从 变量 间 的 相关 推出 因果 关系 的 结论 。 


二 、 相 关 的 性 质 


从 上 述 的 一 些 例子 ,已 经 看 到 ,要 描述 两 个 变量 之 间 的 相关 性 ,需要 把 握 三 个 方面 : 
相关 的 方向 .相关 的 强度 .相关 的 形式 。 


(一 ) 正 相 关 、 负 相关 和 零 相 关 

根据 两 个 变量 在 变化 方向 上 的 关系 ,可 以 将 相关 划分 为 正 相 关 、 负 相关 和 零 相 关 。 

正 相 关 (positive correlation) 是 指 两 个 变量 在 数值 上 的 变化 方向 一 致 。 即 两 列 变量 
的 数值 变化 方向 是 相同 的 :一 个 变量 的 数据 由 大 而 小 变化 时 , 另 一 个 变量 的 数据 也 由 大 
而 小 地 变化 。 如 人 的 身高 和 体重 ,一 般 地 讲 , 越 高 的 也 越 重 。 虽 然 这 并 不 绝对 ,但 这 种 趋 
势 还 是 能 够 观察 得 到 的 。 对 于 有 正 相 关 关 系 的 两 个 变量 ,一 个 设 为 X, 一 个 设 为 Y。 对 许 
多 个 案 测量 得 到 X 和 YY 的 两 列 数据 。 如 果 用 X 作为 横 坐 标 ,Y 作为 纵 坐 标 , 就 可 以 在 二 
维 坐 标 系 中 画 出 每 一 个 个 案 的 坐标 点 。 这 些 点 在 坐标 系 中 构成 了 一 个 散 点 图 ,并 借 此 直 
观 地 反映 X 和 立 之 间 的 变化 关系 。 如 图 7- 1a 反映 的 就 是 正 相关 关系 。 在 这 个 坐标 系 
中 ,可 以 看 到 散 点 的 分 布 趋势 是 左边 低 .右边 高 。 换 名 话说 ,X 比较 小 ,Y 就 可 能 相对 比 
较 小 ;XX 比较 大 ,Y 就 可 能 相对 比较 大 。 

人 负 相 关 (negatie correlation) 是 指 两 个 变量 在 数值 上 的 变化 方向 相反 , 即 两 列 变量 
的 数值 变化 方向 是 相反 的 : 一 个 变量 的 数据 由 大 而 小 变化 时 ， 另 一 个 变量 的 数据 却 
是 由 小 而 大 变化 。 如 图 7-12 反映 的 就 是 负 相 关 关 系 。 在 这 个 坐标 系 中 ,可 以 看 到 散 
点 的 分 布 趋势 是 左边 高 ,右边 低 。 换 名 话说 ,就 是 X 变 大 ,Y 却 可 能 变 小 ;X 变 小 ,Y 
却 变 大 . 
零 相 关 (naught correlation) ,又 称 无 相关 , 即 两 列 变量 的 变化 没有 关联 性 。 一 个 变量 
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似 负 相关 艇 点 图 (ce) 零 相关 或 弱 相关 的 艇 点 图 
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图 7-1 不 同 的 线性 相关 的 艇 点 图 
的 变 大 或 变 小 与 另 一 个 变量 没有 任何 关系 。 如 图 7 - lc 就 是 一 种 零 相关 条 件 下 的 散 点 图 。 


(二 ) 强 相 关 . 弱 相 关 和 完全 相关 
从 变量 关联 的 紧密 程度 上 ,可 以 将 相关 划分 为 强 相 关 、 弱 相关 和 完全 相关 。 如 图 
7-2 中 &.e 所 示 的 散 点 图 分 别 对 应 于 强 的 正 相 关 、 弱 的 正 相 关 ,完全 的 正 相 关 。 


¥ . Y 
(b) 弱 正 相关 (c) 完全 正 相关 
时 . 
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图 7~2 不 同 强度 正 相关 的 散 点 图 


强 相关 又 称 高 度 相 关 。 当 一 个 变量 变化 时 ,与 之 对 应 的 另 一 个 变量 随 之 变化 的 可 能 
性 较 大 ,或 者 说 跟随 其 变化 的 程度 比较 紧密 。 在 散 点 图 上 表现 为 坐标 点 较为 集中 地 分 布 
在 某 一 直线 的 附近 ,如 7-2 中 的 a 图 。 例 如 ,身高 与 体重 的 关系 .学生 的 数学 成 绩 与 物理 
成 绩 的 关系 等 一 般 呈 现 强 正 相关 。 

弱 相 关 又 称 为 低 相关 。 是 指 两 个 变量 之 间 虽 然 有 一 定 的 关系 ,但 联系 的 强度 较 低 。 
即 一 个 变量 变化 时 ,与 之 对 应 的 另 一 个 变量 变化 的 可 能 性 较 小 ,或 者 说 跟随 其 变化 的 程 
度 不 太 明显 。 在 散 点 图 上 表现 为 坐标 点 比较 松散 地 分 布 在 某 一 直线 两 边 较 宽广 的 范围 ， 
如 7-2 中 的 b 图 。 例 如 ,学 生 的 历史 课 成 绩 和 物理 课 成 绩 往 往 是 低 相关 的 。 

完全 相关 是 指 两 个 变量 在 取 值 上 具有 一 一 对 应 或 完全 确定 的 关系 ,两 个 变量 之 间 的 
关系 也 可 以 表示 成 一 个 直线 方程 式 。 在 散 点 图 上 表现 为 各 坐标 点 都 处 在 某 一 条 直线 上 ， 
如 7-2 中 的 < 图 。 例 如 , 辆 半径 和 圆周 长 的 关系 就 是 这 种 完全 相关 关系 。 
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(三 ) 直线 相关 和 曲线 相关 

根据 变量 在 数值 上 的 变化 关系 或 散 点 的 分 布 形式 ,可 以 将 相关 划分 为 直线 相关 和 曲 
线 相关 。 直 线 相关 是 指 两 个 变量 中 的 一 个 变量 在 增加 或 减少 时 , 另 一 个 变量 也 随 之 增加 
或 减少 ,它们 之 间 存 在 一 种 直线 或 线性 相关 的 关系 。 直 线 相关 可 以 用 直线 拟 合 ,其 散 点 
旦 椭圆 分 布 ,我 们 将 要 讨论 的 积 差 相关 ,等 级 相关 、 偏 相关 都 属于 直线 相关 。 曲 线 相关 也 
叫 非 线性 相关 ,是 指 如 果 两 个 变量 相伴 随 的 变化 未 能 形成 直线 相关 ,其 相关 就 是 曲线 的 。 





党 随 


计 


DL 


例如 ,对 数 , 指 数 、 短 函数 曲线 等 均 属 于 曲线 关系 。 如 7 -3 中 的 a 图 显示 的 是 变量 的 直线 
关系 ,b 图 显示 的 是 曲线 关系 。 ， 





图 7-3 线性 与 参 线 性 相关 散 点 图 


第 二 节 积 差 相 关 分 析 


积 差 相关 是 Pearson 建立 起 来 的 ,迄今 应 用 最 广泛 的 相关 分 析 技 术 。 它 以 相关 系数 
的 形式 较为 准确 地 反映 两 个 变量 之 间 的 线性 相关 程度 。 那 么 这 种 相关 系数 的 建立 是 基 
于 一 种 什么 样 的 思想 呢 ? 


一 、 积 差 相 关系 数 计算 的 逻辑 


前 一 节 已 经 介绍 ,可 以 使 用 散 点 图 来 直观 地 反映 变量 之 间 的 相关 关系 ,而 且 散 点 分 
布 的 形式 反映 了 变量 的 相关 性 质 和 相关 强度 。 现 在 ,我 们 就 从 对 散 点 图 的 分 析 开 始 。 
7-4 所 示 的 散 点 图 来 自 于 图 7-1。 假 如 我 们 登记 的 有 散 点 图 中 的 每 一 对 X 和 Y 的 值 ， 
就 可 以 形成 两 列 具 有 一 一 对 应 关系 的 数列 X 和 YY; 计 算出 这 两 个 数列 对 应 的 平均 数 , 即 
X 和 Yi; 于 是 ,我 们 就 可 以 在 原来 的 坐标 系 中 通过 六 二 外 做 一 条 垂直 于 X 轴 的 直线 作为 
新 坐标 系 的 Y 轴 :通过 Y 一 Y 做 一 条 垂直 于 Y 轴 的 直线 作为 新 坐标 系 的 X' 轴 ,这 样 就 建 
立 起 了 一 个 新 的 坐标 系 。 如 图 7 -4, 三 个 坐标 系 中 的 粗 线 就 是 新 坐标 系 的 坐标 轴 。 在 新 
坐标 系 中 ,原来 的 坐标 点 的 位 置 , 以 及 他 们 的 相对 位 置 都 没有 改变 ,所 以 两 个 变量 的 相关 
关系 没有 发 生变 化 。 








散 点 在 新 坐标 系 中 的 坐标 可 以 从 原 坐 标 做 一 一 对 应 的 转换 得 到 ,转换 的 公式 是 : 
x'=X—X (公式 7-1) 
y=Y—Y (公式 7-2) 

下 面 分 析 在 新 坐标 系 中 , 散 点 分 布 及 散 点 坐标 与 变量 间 相 关 度 之 间 的 关系 : 

就 图 7-4 中 的 a 图 来 说 ,反映 两 个 变量 间 是 正 相关 关系 。 在 新 的 坐标 系 中 , 散 点 主 
要 分 布 在 第 一 .第 三 象限 :第 二 、 第 四 象限 中 的 散 点 比较 少 。 因 为 第 一 象限 中 ,点 的 坐标 
都 是 正 的 ;第 三 象限 中 ,点 的 坐标 都 是 负 的 ,也 即 : 第 一 、 第 三 象限 中 点 的 两 个 坐标 相 乘 肯 
定 为 正 ; 第 二 、 第 四 象限 内 点 的 坐标 相 乘 肯定 为 负 。 所 以 这 些 散 点 的 两 个 坐标 相 乘 结果 
是 :大 部 分 为 正 ; 少 部 分 为 负 。 如 果 将 所 有 点 的 坐标 乘积 相 加 ,得 到 的 数值 就 会 比较 大 ， 
即 3)X'Y’ 就 会 比较 大 。 而 且 还 可 以 看 出 ,图 7-4 中 a 图 的 散 点 还 紧密 集中 在 一 条 线 的 
附近 ,此 时 新 坐标 系 中 落 入 第 一 .第 三 象限 的 点 就 更 多 , 落 人 第 二 、 第 四 象限 的 点 更 少 , 意 
味 着 》\X'Y' 会 因此 更 大 ， 

同样 的 道理 ,可 以 分 析 图 7-4 中 b 图 。 在 新 的 坐标 系 中 ,大 部 分 点 落 入 第 二 ,第 四 象 
限 , 而 落 人 第 一 ,第 三 象限 的 较 少 。 这 些 点 的 两 个 坐标 相 乘 结果 中 ,大 部 分 是 负 值 ; 少 部 
分 是 正 值 。 把 这 些 乘积 相 加 就 会 得 到 负 值 ,而 且 这 些 散 点 越 是 密集 地 集中 在 一 条 线 的 附 
近 , 乘 积 相 加 得 到 的 负 值 的 绝对 值 就 越 大 。 

再 分 析 图 7-4 中 的 上 图 :在 新 坐标 系 中 , 散 点 落 人 四 个 象限 的 频率 差不多 。 因 为 两 
个 坐标 乘积 中 得 正 值 和 负 值 的 频率 比较 接近 ,所 以 相 加 时 互相 抵消 ,所 得 乘积 之 和 也 比 
较 接近 于 0。 

如 此 看 来 , 8 X'Y' 可 以 在 相当 程度 上 反映 两 个 变量 线性 相关 的 性 质 和 强度 。 不 
过 ,这 个 乘积 之 和 的 大 小 显然 与 点 数 有 关 , 所 以 就 会 出 现 类 似 这 样 的 可 能 :一 是 两 个 变量 
具有 强 相关 ,但 是 由 于 测量 的 个 案 较 少 , 即 散 点 图 中 的 点 比较 少 ,使 得 2)X Y 比较 小 ; 
二 是 两 个 变量 具有 弱 相 关 , 但 是 由 于 测量 的 个 案 很 多 , 散 点 图 中 的 点 比较 多 ,使 得 
YX'Y' 反而 比较 大 。 为 了 消除 测量 容量 不 同 带 来 的 影响 ,可 以 除 以 测量 样本 的 容量 w， 
得 到 之 XI 一 之 个 一 一 下 ,从 而 形成 一 个 很 有 效 的 相关 测量 指标 。 该 指标 
被 称 为 协 方差 (COV) , 因 两 个 变量 离 均 差 的 乘积 之 和 而 得 名 。 

但 是 如 果 继 续 分 析 , 其 中 还 有 问题 : 当 变量 测量 单位 不 一 样 时 ,其 数值 变化 会 很 大 ;而 
且 两 个 变量 可 能 是 在 完全 不 同 的 测量 系统 中 完成 的 。 为 了 消除 这 些 问题 ,统计 学 家 干脆 将 
变量 值 除 以 各 自 的 标准 差 , 形 成 等 值 单位 。 于 是 ,就 有 了 最 后 的 积 差 相关 系数 的 计算 公式 : 
ra ed | 


Noaov Noxoy 





[dd 2x2 (用 于 总 体 ) 


(公式 ,7 一 3) 


> (X—X)(Y—Y) 1 
~ Me ess ee 一 二 > ee 于 样本 八 直 
nSxSy 1 ZxZs (用 本 ) (公式 7 4) 


通过 这 样 的 分 析 , 我 们 不 仅 得 到 计算 相关 系数 的 简单 公式 ,而 且 更 清晰 认识 了 线性 
相关 的 内 涵 和 相关 系数 大 小 的 意义 。 


三 





TTT ElayeT TN 
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二 、 积 差 相 关系 数 的 计算 


(一 ) 相关 系数 计算 

在 积 差 相关 的 实际 使 用 中 ,一 般 都 是 针对 样本 数据 来 进行 的 ,所 以 更 多 的 是 使 用 * 
及 其 相应 的 计算 公式 。 因 为 积 差 相关 是 统计 学 家 皮尔 还 提出 来 的 ,所 以 也 叫做 皮尔 逊 相 
关 ; 又 因为 它 测量 的 是 变量 间 最 简单 的 关系 一 一 线性 关系 ,所 以 又 叫做 简单 相关 。 

在 运用 公式 7-4 时 , 需 先 计算 平均 数 和 标准 差 , 所 以 有 时 会 带 来 不 方便 。 于 是 统计 
学 家 对 之 进行 推导 和 变换 ,形成 可 以 直接 使 用 原始 数据 的 计算 公式 : 


NY SR 


r= 





(公式 7-5) 


[no XX: — (OX) J- [no YY — (2Y) | 

公式 7 了 7-5 的 方便 之 处 是 :可 以 根据 原始 的 两 列 数据 ,计算 出 两 列 数 据 的 乘积 之 
和 ,每 一 列 数据 的 和 及 和 平方 .每 一 列 数据 的 平方 和 ,然后 代 人 公式 就 可 以 计算 出 相关 
系数 。 

如 果 已 知 两 列 数据 的 标准 分 ,利用 公式 7-4 来 计算 更 加 简便 ， 

【 例 7-1】 下 表 基 10 名 被 试 前 后 两 次 参加 某 心理 测试 的 分 数 , 假 设 其 总 体 分 布 为 
正 态 。 计 算 两 次 测试 分 数 的 相关 系数 ， 


表 7-1 10 名 被 试 两 次 心理 测试 的 分 数 
被 试 1 2 3 4 5 6 7 8 9 10 








第 一 次 76 50 80 65 9%0 48 55 81 32 76 
第 二 次 0 53 90 7 8 70 485 7 0 55 


【 解 】 根据 已 知 条 件 可 知 这 10 名 被 试 前 后 两 次 参加 心理 测试 的 分 数 明正 态 分 布 ， 
且 这 两 列 变量 都 是 观测 变量 ,因此 本 例 可 以 运用 积 差 相关 来 计算 相关 系数 。 

因为 题目 中 给 出 了 原始 数据 ,因此 可 以 利用 公式 7 -5 来 计算 。 将 第 一 次 测试 分 数 记 
为 X, 第 二 次 测试 的 分 数 记 为 了 ,因此 : 


>),X 一 76 十 50 十 … 十 76 一 653 ”>)Y 一 80 十 53 十 … 十 55 一 666 

> )X2 一 76: 十 502 十 … 十 76: 一 45691 >)Y2 二 80: 十 53* 十 -… 十 557 一 47694 
>)XY 一 76X80 十 50X53 十 … 十 76X55 一 46036 

DIXDY =653X666=434898 

将 上 述 结 果 代 人 公式 7-5 可 得 : 

nAY= SX 


站 = 





[nD — (Tx) [nv — (CE) 


10X 46036—434898 





0. 798 








VCIOX45697 二 6537) (10X47694—666) 


(二 ) 相关 系数 的 显著 性 检验 
相关 系数 的 显著 性 检验 即 由 样本 相关 系数 推断 总 体 是 否 相 关 。 由 于 相关 系数 的 样 


本 分 布 比较 复杂 , 受 p 影 响 大 ,一 般 分 为 p=0 和 p 取 0。 但 不 管 是 p 二 0 还 是 p 隆 0, 其 显著 
性 检验 的 基本 步骤 是 相同 的 。 就 Pearson 相关 系数 来 说 , 它 符合 自由 度 为 ”一 2 的 上 分 
布 。 其 检验 的 程序 是 : 

步骤 1: 提出 虚无 假设 HH, : 设 总 体 相 关系 数 等 于 0; 

步骤 2: 计 算 检验 统计 基 ! 值 和 自由 度 dff; 


(一 一 一 (公式 7-6) 


df 一 "一 2 (公式 7 一 7) 
步骤 3: 查 附 表 3 的 z 值 表 , 进 行 统计 推断 。 


三 ) 相关 系数 的 合并 

如 果 已 经 根据 几 个 不 同 的 样本 ,分别 计算 出 了 两 个 变量 间 多 个 相关 系数 ,那么 ,如 何 
将 相关 系数 合并 得 到 合并 后 较 大 样本 的 相关 系数 呢 ? 

由 于 相关 系数 之 间 不 具有 相 加 性 ,所 以 不 能 直接 将 在 几 个 样本 中 得 到 的 相关 系数 平 
均 。 但 是 .可 以 根据 Fisher 的 Z-r 转换 表 来 完成 这 种 相关 系数 的 合并 。 具体 步骤 是 了 了; 

步骤 1: 查 附 表 7 的 Fisher Z-r 转 换 表 ,将 各 个 样本 的 相关 系数 值 转换 成 Z 分 数 ; 

步 又 2: 计算 样本 Z 分 数 的 平均 分 Z。 如 果 各 样本 的 容量 相等 , 则 直接 将 各 个 标准 分 
相 加 再 平均 ;如 果 各 样本 的 容量 不 相等 , 则 需要 按照 以 下 公式 计算 平均 的 Z 分数; 
7 》) (市 一 3)。2Z 

.0% 一 3) 

步骤 3; 查 附 表 7 的 Fisher Zr 转换 表 , 将 平均 Z 分 数 转换 成 相关 系数 , 即 为 平均 的 相 
关系 数 。 

【 例 7-2】 有 两 位 研究 者 分 别 在 50 人 的 大 学 生男 生 样 本 中 得 到 其 记忆 力 与 英语 成 
绩 的 相关 系数 为 0.530; 在 39 人 的 大 学 女生 样本 中 得 到 记忆 力 与 英语 成 绩 的 相关 系数 为 
0. 752。 试 根据 这 两 个 样本 计算 记忆 力 与 英语 成 绩 的 平均 的 相关 系数 。 

【 解 】 要 将 这 两 个 相关 系数 合并 得 到 平均 的 相关 系数 ,首先 要 查 Fisher Zr 转换 表 
将 两 个 相关 系数 转换 成 标准 分 数 。 已 知 男 生 样 本 得 到 的 二 0.530, 女 生 样 本 得 到 的 7， 
二 0.752, 所 以 查 Fisher Zr 转换 表 得 到 :Z, 二 0.590,2Z; 一 0. 977。 

因为 两 个 样本 容量 不 相等 ,所 以 使 用 公式 7 -8 来 计算 平均 的 Z 分 数 , 即 : 

(1 一 3)。2i .5 0.9 
7 _ 2 ~ 47X0.590+36X0.977 一 0.758 


再 查 Zr 表 , 将 Z 转换 为 7, 这 就 是 将 男生 与 女生 样本 的 相关 系数 合并 后 的 相关 系数 。 
三 、 相 关系 数 大 小 的 意义 


根据 变量 间 共 变 关系 的 密切 程度 ,相关 系数 大 小 也 不 一 样 ,但 它 总 是 介 于 十 1.00 至 
一 1.00 之 间 的 ,有 正 、 负 之 分 。 正 , 负 号 代表 相关 的 性 质 ; 相 关系 数 的 绝对 值 大 小 则 反映 


(公式 7-8) 


中 车 寄生 , 王 爱 平 .证 冉 尺 心理 与 社会 研究 统计 方法 ,北京 师范 大 学 出 版 社 ,2006 年 版 ,第 137- 138 页 ， 
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.8D 遇 字 汪 冰 茵 其 中 串 


了 变 基 间 的 相关 强度 。 也 就 是 说 ,判断 两 个 变量 间 的 相关 强度 是 看 相关 系数 的 绝对 值 大 
小 ,而 不 看 其 正 负 号 。 

如 图 7-5 所 示 , 不 同方 向 和 不 同 强度 的 相关 ,对 应 的 相关 系数 也 就 不 一 样 。 
4 ¥ 
(yj 省 各 下 相关 (b) 完全 人 负 相 关 
r=+1,00 rm 一 1.00 


¥ ¥ 
{d) 强 正 相关 (e) 弱 正 相关 
r=+0.89 










图 7-5 不 同方 向 不 同 强度 的 相关 对 应 的 相关 系数 


(a) 完全 正 相关 ,> 一 十 1.00, 相 关系 数 绝 对 值 达 到 最 大 ,为 最 强 正 相关 ; 

(b) 完全 负 相 关 ,r 三 一 1.00, 相 关系 数 绝 对 值 达 到 最 大 ,为 最 强 负 相关 ; 

(c) 零 相 关 ,r 二 0.00, 相 关系 数 绝对 值 达 到 最 小 ,为 无 相关 ; 

(d) 强 正 相 关 ,r 二 十 0, 89, 相 关系 数 绝对 值 较 大 ,为 较 强 正 相 关 ; 

(e) 弱 正 相关 ,r 三 十 0. 58, 相 关系 数 绝对 较 小 ,为 较 弱 正 相 关 ; 

(f) 中 等 强度 负 相 关 ,r 一 一 0. 70, 相 关系 数 绝对 值 中 等 大 小 ,为 中 等 强度 的 负 相 关 。 

在 通过 相关 系数 比较 相关 强度 的 时 候 ,需要 注意 的 一 点 是 ,相关 系数 不 是 等 距 或 等 
比 变量 。 所 以 在 比较 相关 系数 的 时 候 , 不 能 直接 使 用 相 除 来 计算 它们 的 比例 关系 。 如 ; 
不 能 认为 "三 十 0. 90 的 相关 强度 等 于 "= 一 十 0. 45 的 两 倍 。 当 然 , 相 关系 数 也 不 能 使 用 简 
单 的 加 减 运算 。 


四 、 积 差 相关 的 适用 条 件 


一 般 来 说 ,用 积 差 相关 计算 相关 系数 的 数据 要 满足 以 下 条 件 :(1) 要 求 成 对 的 数据 ， 
即 若干 个 体 中 每 一 个 体 都 有 对 应 的 两 个 观测 值 ,或 者 配对 样本 中 每 对 个 体 分 别 测 基 得 到 
的 两 个 变量 值 ;(2) 数 据 均 来 自 于 正 态 分 布 的 总 体 ;(3) 数 据 是 等 距 . 连 续 的 ,包括 等 距 量 
表 数 据 和 等 比 量 表 数 据 ;(4) 两 列 变 量 之 间 的 关系 应 该 是 直线 性 的 ;(5) 样 本 容量 不 宜 太 
小 ,成 对 数据 的 数目 不 宜 少 于 30 对 ,否则 由 于 数据 太 少 而 缺乏 代表 性 ,计算 出 的 积 差 相 
关系 数 将 不 能 有 效 说 明 两 列 数据 的 相关 关系 ， 

另外 ,还 需 注 意 计算 相关 系数 时 所 测 基 的 样本 是 不 是 具有 代表 性 ,变量 的 取 值 范围 
是 否 具 有 代表 性 ,具体 地 说 : 

(1) 同样 的 两 个 变量 ,在 不 同样 本 中 会 得 到 不 同 的 相关 系数 。 比 如 ,在 大 学 生 群 体 
中 抽取 样本 ,研究 智力 水 平 与 课程 考试 成 绩 之 间 的 相关 时 ,相关 系数 可 能 会 是 弱 的 正 相 
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关 ; 而 在 小 学 生 样本 中 ,同样 研究 智力 水 平 与 课程 考试 成 绩 之 间 的 相关 时 ,相关 系数 可 能 
会 是 较 强 的 正 相 关 。 这 一 点 启示 我 们 在 研究 两 个 变量 的 相关 时 ,要 注意 取样 问题 。 即 在 
一 个 什么 样 的 总 体 中 选取 样本 ,才能 更 好 地 评估 变量 间 的 相关 关系 ?还 有 ,在 两 个 不 同 
样本 中 得 到 的 相关 系数 ,不 宜 作 简单 比较 。 因 为 在 两 个 不 同样 本 中 ,变量 的 取 值 范围 可 
能 会 有 了 所 不 同 。 

(2) 变量 取 值 范围 的 影响 。 存 在 较 强 相关 的 两 个 变量 ,如 果 变 量 值 的 测量 范围 不 全 
适 , 也 可 能 得 到 很 低 的 相关 ,甚至 接近 于 0 的 相关 。 比 如 ,上 述 谈 到 的 智力 与 课程 成 绩 的 
相关 问题 ,如 果 在 一 个 较 大 的 智力 水 平 范围 内 选取 被 试 ,得 到 的 相关 系数 可 能 会 比较 大 ; 
但 是 如 果 在 一 个 重点 中 学 的 重点 班级 中 选取 被 试 . 测 基 得 到 的 相关 系数 可 能 就 很 低 。 因 
为 如 果 样 本 中 被 试 的 智力 水 平 都 很 高 ,那么 智力 水 平 测 其 选择 了 一 个 较为 狭窄 的 范围 。 
换 句 话说 ,在 智力 水 平 都 比较 接近 的 情况 下 ,学 业 成 绩 就 取决 于 其 他 方面 的 因素 了 ,从 而 
显示 出 智力 与 学 业 成 绩 间 的 低 相 关 ， 


第 三 节 ”等 级 相关 分 析 


在 心理 与 教育 领域 中 ,有 时 会 出 现 以 下 两 种 情况 :(1) 搜 集 到 的 数据 不 是 等 距 或 等 比 
的 ,而 是 具有 等 级 或 顺序 的 测量 数据 。(2) 搜 集 到 的 数据 是 等 距 或 等 比 的 ,但 不 能 确定 其 
是 否 来 自 于 正 态 总 体 , 且 为 小 样本 。 此 时 ,如 果 计 算 两 列 或 两 列 以 上 变量 的 相关 ,就 要 用 
到 等 级 相关 。 因 为 等 级 相关 对 变量 的 总 体 分 布 不 做 要 求 , 故 又 称 为 非 参 数 的 相关 方法 。 
本 节 所 讨论 的 等 级 相关 ,也 属于 线性 相关 方法 ， 

本 节 主 要 介绍 适合 于 计算 两 列 变量 等 级 相关 的 斯 皮尔 曼 相关 方法 .以 及 适合 于 计算 
多 列 变量 相关 的 肯 德 尔 和 协 系 数 的 计算 。 


一 、 斯 皮尔 曼 等 级 相关 


(一 ) 斯 皮尔 曼 等 级 相关 的 适用 条 件 

斯 皮尔 最 等 级 相关 (Spearman's correlation coefficient for ranked data) 是 等 级 相关 
的 一 种 .常用 符号 rs 或 rs 表示 ,有 时 也 称 为 斯 皮尔 芭 p 系数 ( 读 作 Spearman's rho)。 下 
面 两 种 情况 适合 采用 斯 皮尔 总 等 级 相关 :(1) 只 有 两 列 变量 , 且 具 有 等 级 变量 性 质 , 具 有 
线性 关系 的 资料 ,主要 用 于 解决 称 名 数据 和 顺序 数据 的 相关 问题 ;(2) 即 使 是 属于 等 距 或 
等 比 性 质 的 变量 . 若 按 其 取 值 大 小 , 赋 以 等 级 或 顺序 , 亦 可 计算 等 级 相关 。 

从 以 上 斯 皮尔 昌 等 级 相关 适用 条 件 来 看 . 它 不 对 数据 的 整体 分 布 状态 做 要 求 。 不 管 
数据 是 不 是 正 态 分 布 ,都 可 以 用 等 级 相关 计算 相关 系数 。 因此 等 级 相关 的 适用 范围 比 积 
差 相 关 大 ,这 是 它 的 优点 ,并 且 当 样 布 容量 "一 30 时 ,计算 也 比较 简便 。 但 是 等 级 相关 也 
有 缺点 :同一 组 能 计算 积 差 相关 的 资料 若 改 用 等 级 相关 计算 ,就 会 损失 一 部 分 信息 ,导致 
精确 度 降低 。 因 此 , 凡 符合 积 差 相关 计算 条 件 的 资料 ,不 要 用 等 级 相关 计算 。 


(二 ) 斯 皮尔 曼 等 级 相关 的 计算 方法 
计算 斯 皮尔 曼 相关 系数 的 基本 公式 是 : 


TT 


和 二 和 es 一 一 一 一 
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LLL 


(公式 7-9) 


公式 中 :D 表示 各 对 数据 在 等 级 上 的 差异 量 , N 表示 观测 样本 的 容量 。 比 如 对 一 个 
20 人 的 班级 进行 数学 和 物理 测验 , 则 N= 二 20。 得 到 小 明 的 测验 成 绩 的 排名 :数学 成 绩 在 
全 班 排 第 10 名 , 即 Rx 二 10; 物 理 成 绩 在 全 班 排 第 15 名 , 即 Ry = 二 15。 则 两 门 课 成 绩 等 级 
的 差异 量 D=Rx 一 Ry 二 10 一 15= 一 5。 


斯 皮尔 曼 相关 计算 的 步骤 是 ，; 


步骤 1 ;数据 转换 ,即将 两 列 数据 均 按 由 小 到 大 或 由 大 到 小 的 顺序 排列 ,以 便 将 其 转 


换 为 等 级 数 Rx 与 Ry; 


步 又 2: 重 新 进行 排列 , 即 把 每 一 个 体 两 个 数据 对 应 的 等 级 对 应 起 来 排列 ; 
步骤 3: 计 算 等 级 差 数 , 即 计 算 每 一 成 对 数据 的 等 级 差 D==Rx 一 Ry ,并 计算 >) D? ; 


步骤 4: 将 数据 代入 公式 7- 9, 得 到 等 级 相关 系数 ; 
步骤 5: 进 行 显 著 性 检验 ,方法 与 积 差 相 关 显 著 性 检验 相同 。 


【 例 7-3】 有 16 名 学 生 和 参加 了 智商 测验 和 数学 课程 考试 ,成 绩 如 表 7 -2 所 示 , 试 


计算 斯 皮尔 曼 等 级 相关 。 中 


【 解 】 先 按 从 小 到 大 的 顺序 对 X 和 YY 两 列 数据 进行 排列 ,得 到 每 个 测试 分 数 在 所 在 数 
据 列 中 的 排列 等 级 ,然后 将 每 一 学 生 智商 分 数 ,数学 分 数 的 等 级 数 对 应 排 在 该 学 生 的 后 面 。 
表 7-2 等 级 相关 例题 数据 及 相关 系数 计算 过 程 


学 生 编 号 ”智商 X 
1 82 
2 86 
3 87 
4 88 
5 92 
6 94 
7 96 
8 97 
9 100 
10 100 
11 102 
12 105 
13 106 
14 108 
15 110 
16 113 


数学 成 绩 Y Rx 
75 ET 
81 2.0 
85 3.0 
73 4.0 
87 5.0 
79 6.0 
95 7.0 
85 8.0 
81 9.5 
88 9.5 
95 11.0 
89 12.0 
85 13.0 
100 14.0 
90 15.0 
97 16.0 


Ry 


2.0 
4.5 
?7.0 
1.0 
9.0 
3.0 
13.5 
0 
4.5 
10.0 
13.5 
11.0 
7.0 
16.0 
12.0 
15.0 


D 并 
一 1.00 
一 255 6. 25 
一 4.0 16.00 

3.0 9.00 
一 4 人 ,1&00 

3.0 9. 00 
~6.5 42.25 

1.0 1.00 

5.0 25.00 
= 0. 25 
一 人 6. 25 

1.0 1.00 

6.0 36.00 
二 有 4. 00 

3.0 9.00 

1.0 1. 00 

0.0 183.00 





遇 到 相同 分 数 的 时 候 , 先 排 定 这 些 分 数 在 数列 中 所 占 的 位 次 ,然后 取 相同 数据 所 占 
位 次 的 中 间 值 作为 它们 的 等 级 值 。 如 表 7 -2 中 的 Y 的 数列 中 ,有 两 个 81 分 ,在 排列 中 
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应 占 两 个 位 次 , 即 4 和 5, 取 这 一 位 次 范围 的 中 点 4. 5 作为 两 个 81 分 的 等 级 值 ; 同 样 ,对 
于 三 个 85 分 ,因为 所 占 位 次 范围 是 6 至 8, 所 以 用 7.0 作为 三 个 数据 的 等 级 值 。 

计算 ,进而 计算 出 > D: = 183. 00 ,将 数据 代入 公式 7-9 即 可 得 到 斯 皮尔 曼 相 关 

系数 : 
全 
N(CN: 一 1) 16 XX (16 一 1 
以 1 分 布 检验 相关 系数 的 显著 性 水 平 , 将 数据 代入 公式 7 -6 和 公式 7-7 可 得 ; 
A 0 E ot =3.997,df=14 

查 附 表 3 的 1 值 表 可 知 ,df=14 时 ,0.01 显著 性 水 平 对 应 的 上 的 临界 值 为 2. 977, 所 
以 本 例 中 的 相关 系数 达到 了 0.01 显著 性 水 平 。 

斯 皮尔 曼 等 级 相关 主要 通过 计算 每 一 个 案 两 个 观测 值 的 等 级 差 来 完成 ,该 方法 主要 
适用 于 样本 量 N 一 30 的 情况 。 样 本 容量 很 大 时 ,这 样 做 比较 繁琐 ,可 直接 使 用 数据 的 排 
列 等 级 进行 计算 ,该 方法 又 称 等 级 序数 法 ,公式 为 : 

RE 4 RxRy 
mm NI [SR 
公式 中 ,Rx 与 Ry 为 两 列 变量 各 自 排列 的 等 级 序数 。 

【 例 7-4】 现 有 10 个 学 生 的 数学 成 绩 名 次 和 语文 成 绩 名 次 , 问 这 10 名 学 生 的 数学 
成 绩 和 语文 成 绩 排 位 是 否 具 有 一 致 性 ? 

表 7-3 10 学 生 数 学 与 语文 成 绩 及 其 相关 计算 的 过 程 


一 
学 生 数学 成 绩 名 次 Rx 语文 成 绩 名 次 Ry D=Rx— Ry D: RxRy 


一 0. 731 


Fh 二 


-CN+D | (公式 7- 10) 





1 7 5 2 1 35 
2 2 2 0 0 1 
3 5 1 4 16 5 
4 8 8 0 0 64 
5 1 6 一 5 25 6 
6 9 10 一 ! 1 90 
7 10 9 1 1 90 
8 6 7 1 1 42 
9 4 | 0 0 16 
10 3 3 0 0 9 

党 55 55 48 361 





【 解 】 此 题 研 究 的 是 数学 成 绩 和 语文 成 绩 排名 是 否 具 有 一 致 性 ,而 且 是 同一 组 被 试 
测 得 的 成 对 数据 ,其 数据 类 型 是 顺序 的 ,因此 选用 斯 皮尔 曼 等 级 相关 。 

先 按照 公式 7- 9 的 方法 进行 计算 。 已 知 N=10，>) :一 48, 将 数据 代入 公式 7-9 
可 得 : 


6X48 


ey 


mk 一 ] 


9 四 各 汪 十 水 关山 中 加 
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eo WD DW 


再 按照 公式 7- 10 的 方法 进行 计算 。 已 知 N 一 10, 将 表 7- 3 中 相应 数据 代入 公式 
7-10 可 得 ， 


ra 


“10=1 L1010+1) 
两 种 算法 所 得 结果 完全 一 致 ,10 名 学 生 数 学 与 语文 的 考试 成 绩 等 级 相关 系数 为 
0.709, 说 明 他 们 在 两 门 课程 中 的 成 绩 排名 比较 一 致 。 


二 、 肯 德尔 和 协 系数 


斯 皮尔 曼 等 级 相关 主要 适用 于 两 列 数据 的 等 级 相关 ;如 果 想 获得 多 列 变量 间 等 级 相 
关系 数 则 要 采用 肯 德 尔 等 级 相关 。 下 面 我 们 介绍 肯 德 尔 等 级 相关 中 较 常 用 的 肯 德 尔 系 
数 , 也 叫做 肯 德 尔 和 协 系数 (Kendall coefficient of concordance)。 

假设 有 10 位 评价 者 对 7 本 文学 作品 进行 整体 评价 ,那么 如 何 评估 这 10 位 评价 者 评分 
的 一 致 性 ”假设 某 用 人 单位 为 了 招聘 工作 人 员 , 聘 请 了 5 位 面试 考官 来 给 10 位 应 聘 者 评 
分 ,那么 如 何 对 考官 评分 的 一 致 性 (又 称 评 分 者 信 度 ) 进 行 评 估 ? 很 显然 ,其 中 涉及 的 数据 多 
半 是 顺序 变量 ,不 适合 做 积 差 相关 ;同时 ,由 于 数据 超过 了 两 列 , 也 不 适合 做 斯 皮尔 曼 等 级 相 
关 。 这 时 可 计算 肯 德 尔 和 协 系 数 (Kendall'W, 常 用 符号 W 表示 ) 来 对 之 进行 评估 了 。 

采用 肯 德 尔 W 系数 进行 计算 的 变 基 数据 一 般 是 采用 等 级 评定 方法 获得 , 即 个 评价 
者 对 N 件 事 、N 件 作品 或 N 个 考生 进行 评定 ,可 获得 k 列 从 1 至 NN 的 等 级 变量 资料 。 

德尔 W 系数 的 基本 计算 公式 是 : 


3 [ | 一 (10+1) |=0. 709 





- 2 
k*(N’— N) AN 一 及) 
公式 中 ,R, 代表 每 一 被 评价 对 象 在 所 有 人 个 评价 者 那里 所 获得 的 评级 之 和 ,N 代表 
被 评价 对 象 的 数目 ;k 代表 评价 者 的 数目 。 
利用 公式 7- 11 所 计算 的 W 值 必定 介 于 0 与 1 之 间 , 越 接近 于 0 说 明 评价 者 评定 的 
等 级 越 是 不 一 致 , 越 接近 于 1 说 明 评价 者 评定 的 等 级 越 是 一 致 ， 
如 果 出 现 极端 值 ,比如 说 W 等 于 0, 则 说 明 评价 者 的 评定 等 级 完全 不 一 致 ;W 等 于 
1, 则 说 明 评价 者 的 评定 等 级 完全 一 致 
【 例 7-5】 有 10 位 读者 对 7 本 文学 作品 进行 评价 ,要 求 根据 自己 对 这 些 作品 的 喜好 
程度 进行 排序 ,结果 如 表 7 -4 所 了 示 。 问 这 10 位 读者 对 7 本 作品 的 喜好 顺序 具有 -一致 性 吗 ? 
表 7-4 10 位 读者 对 7 件 文学 作品 的 评价 等 级 


评价 者 (= 10) 





(公式 7 一 11) 




















] 2 4 - - 1089 
2 7 了 7 了 3969 
| 5 6 1 1 5 2500 
1 1 2 2 ] ] 225 
5 4 3 8 小” 污 1600 
6 3 1 1 3 2 280 
7 6 5 ”tt 3844 


【 解 】 此 类 数据 采用 肯 德 尔 W 系数 来 评估 。 已 知 N=7.k 二 10。 
先 根据 表 7 -4 中 的 数据 ,计算 每 一 件 作品 获得 的 评价 等 级 之 和 , 即 表 中 Ri 对 应 的 一 
列 数据 ,进而 计算 局 即 表 中 最 后 一 列 数据 。 将 这 两 列 数据 各 自 求 和 得 到 : 2 R; 二 280， 


>)R; = 13516 ,数据 代 人 公式 7- 11 可 得 ; 
12° [OR — (DR)/N] _ 12X(13516 一 280:/7) _ 
本 AN 一 N) Eee 
从 所 得 W 值 看 ,10 位 读者 对 这 ?7 部 作品 的 评价 或 喜好 度 具有 较 高 的 一 致 性 。 


第 四 节 ” 偏 相 关 分 析 


简单 相关 分 析 通 过 计算 两 个 变量 间 的 相关 系数 ,分 析 两 个 变量 间 的 线性 关联 程度 。 
但 往往 因为 第 三 变量 的 作用 ,使 相关 系数 不 能 真正 反映 两 个 变 基 间 的 线性 相关 程度 。 例 
如 ,1 一 5 岁 儿 童 的 身高 和 言语 能 力 的 相关 系数 为 0.85。 但 如 果 排 除 年 龄 的 因素 , 则 儿童 
身高 和 言语 能 力 之 间 的 相关 系数 可 能 就 达 不 到 显著 水 平 。 怎 样 排除 年 龄 因素 的 影响 ,对 
儿童 身高 和 言语 能 力 进行 相关 分 析 ? 这 就 要 采用 偏 相 关 分 析 技 术 。 
偏 相 关 (partial correlation) ,也 称 单纯 相关 , 偏 相关 分 析 的 任务 是 :在 研究 两 个 变量 
之 间 的 线性 关系 时 ,控制 可 能 对 其 产生 影响 的 其 他 变量 。 即 在 计算 两 个 连续 变量 与 y 
之 间 的 相关 时 ,将 第 三 变量 = 或 其 他 多 个 变量 的 影响 排除 ,排除 :和 "后 得 到 的 + 与 y 
这 两 个 变量 之 间 的 纯净 相关 ,用 符号 7,, .表示 。 点 号 左边 的 两 个 下 标 代 表 要 计算 的 偏 相 
美的 两 个 变量 ,点 号 右边 的 下 标 表示 要 消除 其 影响 的 变量 。 偏 相关 的 计算 公式 如 下 : 
pe i ds 
r， ,是 控制 了 变量 = 的 影响 的 情况 下 计算 的 zy 之 间 的 偏 相关 系数 。r* 是 变量 zy 
间 的 简单 相关 系数 或 称 零 阶 相关 系数 ,r- 和 ,分 别 是 变量 zz 间 和 变量 .= 间 的 简单 
相关 系数 。 
偏 相关 系数 的 显著 性 检验 也 使 用 : 分 布 , 检 验 统计 量 上 值 及 自由 度 的 计算 公式 为 : 
jt Yn -a 《公式 和 13) 


《会 式 2 一 12) 


df=n—k—2 (公式 7 一 14) 


公式 中 ,r 是 要 检验 的 偏 相关 系数 ,n 是 观测 样本 的 容量 ,k 是 被 控制 变量 的 数目 。 

【 例 7-6】 某 地 20 名 13 岁 男 童 身高 (X) ,肺活量 (Y) 和 体重 (2Z), 以 及 一 个 学 期 末 
的 体育 课 成 绩 等 级 如 表 7- 5 所 示 。 试 计算 在 控制 了 体重 变 基 影响 时 身高 与 肺活量 的 偶 
相关 系数 。 

【 解 】 设 身 高 .肺活量 和 体重 三 个 变量 分 别 为 X.Y.Z。 首 先 采用 皮尔 进 积 差 相关 计 
算得 到 以 下 三 个 简单 相关 系数 :x,, 二 0. 556、r,, 二 0.634、r, 二 0. 804, 将 这 些 数据 代入 公 
式 7 了 -12 可 得 : 

rz 一 re。re — 0.556—0.634X0.804 _ 


ee pr 
(二 及)0 一 二 ) V0.634)(1—0.804) 


一 0. 100 





TTY Bale EN 





表 7-5 20 名 男 童 的 身高 ,体重 、 肺 活 量 数据 


编号 身高 (cm) 肺活量 (1) 体重 (kg) 体育 成 绩 等 级 
1 135, 10 Nr 32. 00 1 
2 146, 50 2. 50 33, 50 3 
3 167. 80 2..73 41, 50 a 
1 148. 50 和 37. 20 3 
5 153. 30 2.75 41, 00 3 
6 153. 00 .了 32. 00 2 
? 155. 10 2.75 44.70 2 
8 149. 90 二 二 33. 90 3 
9 158. 20 2.00 37. 50 2 
10 154. 60 2. 50 39. 50 2 
11 139. 90 1.75 30, 40 2 
12 156, 20 .75 37. 10 3 
13 149. 70 1. 50 31.00 1 
14 165, 50 3.00 49, 50 3 
15 152. 00 1.75 32.00 1 
16 147. 60 2.00 40. 50 2 
17 160. 50 2.00 37, 50 2 
18 160. 80 2.75 40, 40 2 
19 150. 00 7 36. 00 1 
20 156. 50 1 75 32.00 1 





控制 体重 的 影响 后 ,身高 与 肺活量 的 偏 相 关系 数 为 0.100。 
对 这 一 偏 相关 系数 进行 显著 性 检验 。 将 数据 代 人 公式 7- 13 和 公式 ?- 14 可 得 : 
ED 
内 v1—0. 100 
df=n—k—2=17 
而 自由 度 等 于 17 时 ,0.05 显著 性 水 平 的 上 值 为 2.11。 可见 本 例 中 的 偏 相 关系 数 远 未 
达到 显著 性 水 平 , 说 明 控制 了 体重 变量 的 影响 之 后 ,身高 与 肺活量 不 存在 明显 的 相关 性 。 
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第 五 节 相关 分 析 的 SPSS 过 程 


在 掌握 了 皮尔 逊 积 差 相 关 ,斯 皮尔 曼 等 级 相关 , 肯 德 尔 和 协 系 数 W 以 及 偏 相 关 的 概 
念 ,原理 和 计算 方法 后 ,我 们 感到 , 当 数 据 基 很 大 时 ,其 中 的 计算 基 就 很 大 ,所 以 我 们 更 感 
兴趣 的 是 利用 SPSS 软件 如 何 快捷 地 计算 这 些 相关 系数 。 


一 、 二 元 相关 分 析 的 SPSS 过 程 


二 元 变量 相关 分 析 (Bivariate Correlation) 就 是 直接 根据 两 个 变量 的 观测 值 计算 二 者 
的 相关 系数 ,这 是 最 为 常用 的 相关 分 析 界 面 , 它 既 包括 皮尔 逊 积 差 相 关 , 也 包括 斯 皮尔 曼 
等 级 相关 ,也 就 是 说 这 两 种 相关 分 析 的 命令 在 同一 个 对 话 框 上 ,研究 者 根据 需要 作出 选 
择 即 可 。 下 面 ,以 表 7 -5 所 示 的 数据 来 介绍 这 两 种 相关 分 析 的 SPSS 过 程 , 即 利用 SPSS 


软件 来 计算 身高 .肺活量 ,体重 之 间 的 积 差 相 关 , 以 及 这 三 个 变量 与 体育 成 绩 之 间 的 斯 皮 
尔 曼 等 级 相关 。 具 体操 作 过 程 是 : 

步骤 1: 根据 表 ?7-5 中 各 个 变量 及 其 数据 形式 ,建立 正确 的 SPSS 数据 文件 。 该 文件 
应 该 是 20 行 ,4 列 ,4. 列 变量 分 别 是 身高 (height) ,肺活量 (capacity) ,体重 (weight) ,体育 
成 绩 (level) ; 

步 2; 单 击 "Analyze” 菜 单 选择 “Correlate” 中 的 "Bivariate” 命 令 项 ,打开 对 话 框 ,如 
图 7-6 所 示 。 

步骤 3: 先 计算 积 差 相关 。 从 对 话 框 的 左边 变量 列表 中 选择 三 个 连续 变化 的 变量 ,将 
这 些 变量 置 人 右边 的 变量 框 中 。 在 对 话 框 上 色 选 “Pearson ”项 (一 般 是 默认 的 选项 )。 在 
不 能 确定 是 正 相 关 还 是 负 相关 时 ,选择 双 侧 检验 (一 般 为 默认 选项 ) 。 单 击 ”“OK "按钮 输 
出 三 个 变量 间 的 积 差 相关 。 
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步骤 4: 根 据 输出 结果 , 读 取 积 差 三 个 变量 两 两 之 间 的 相关 系数 。SPSS 系统 输出 的 


结果 如 表 7-6 所 示 , 这 是 一 个 相关 和 矩阵。 所 有 变量 的 两 两 之 间 都 有 一 个 积 差 相 关系 数 ， 

以 及 对 应 的 显著 性 水 平和 观测 样本 的 容量 N。 本 例 中 得 到 :身高 与 肺活量 相关 系数 为 

0.556, 显 著 性 水 平 p= 二 0. 011 一 0. 05; 身 高 与 体重 相关 系数 为 0.634, 显 著 性 水 平 Pp 二 

0.003 二 0,01; 肺 活 量 与 体重 相关 系数 为 0.804, 显 著 性 水 平 p=0. 000 一 0. 001 。 
表 7-6 Correlations 





HEIGHT CAPACITY WEIGHT 





HEIGHT Pearson Correlation 1 .556 . 634 
Sig. (2 — tailed) .011 .003 
N 20 20 20 
CAPACITY Pearson Correlation .556 1 ,804 
Sig. (2— tailed) 0011 .000 
N 20 20 20 
WEIGHT Pearson Correlation .634 .804 1 
Sig. (2 - tailed) .003 .000 


N 20 20 20 





步骤 5: 计 算 斯 皮尔 曼 等 级 相关 。 从 对 话 框 的 左边 变量 列表 中 选择 所 有 四 个 变量 ,将 
这 些 变 最 置 人 右边 的 变量 框 中 。 在 对 话 框 上 勾 选 "Spearman”" 项 。 在 不 能 确定 是 正 相关 
还 是 负 相 关 时 ,选择 双 侧 检验 (一 般 为 默认 选项 )。 如 图 7-7 所 示 。 单 击 "OK" 按 钮 输出 
四 个 变 基 间 的 等 级 相关 。 
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图 7-7 Spearman 相关 分 析 对 话 框 


步 又 6: 根 据 输出 结果 , 读 取 前 三 个 变量 与 体育 成 绩 等 级 间 的 等 级 相关 系数 。SPSS 
系统 输出 的 结果 与 表 7 -6 相似 ,也 是 一 个 相关 矩阵。 本 例 中 得 到 ;身高 与 体育 成 绩 等 级 
相关 为 0. 207, 显 著 性 水 平 p 二 0. 382 二 0. 05; 肺 活 量 与 体育 成 绩 等 级 相关 为 0.776, 显 著 
性 水 平 p= 二 0.000 二 0. 001; 体 重 与 体育 成 绩 等 级 相关 为 0. 504, 显 著 性 水 平 p==0. 023 
-0 


二 、 肯 德尔 和 协 系数 计算 的 SPSS 过 程 


肯 德 尔 和 协 系数 是 评估 评分 者 信和 度 的 良好 指标 ,我 们 通过 实例 来 介绍 其 SPSS 过 程 。 
【 例 7-7】 在 某 面试 考场 ,有 5 位 考官 给 10 位 考生 打分 ,分 数 是 以 1 一 9 的 等 级 表 
示 的 ,结果 如 表 7-?7 所 示 。 请 评定 这 5 位 考官 评分 的 一 致 性 。 


表 7-7 5 名 考官 给 10 名 考生 的 评分 表 


CLT 2 玉河 oh on 习 世 可 卡 于 上 莹 沿 忆 


ks9 ksl10 





以 下 列 步 骤 完 成 肯 德 尔 和 协 系 数 的 计算 : 
步骤 1: 根 据 表 7-7 中 的 数据 建立 合适 的 数据 文件 。 因 为 计算 和 协 系 数 的 特殊 需 
要 ,这 一 数据 文件 的 建立 要 以 考官 为 个 案 . 以 考生 的 得 分 作为 变量 列 , 即 该 SPSS 数据 文 


164 .9 人 





图 7-8 肯 德 尔 和 协 系数 计算 的 SPSS 数据 文件 
件 是 5 行 10 列 ,如 图 7-8 所 示 。 


步骤 2: 单 击 菜单 "Analyze" 选 择 *Nonparametric Tests "中 的 "K Related Samples…”, 打 
开 对 话 框 , 如 图 7-9 所 示 。 





图 7-9 和 名 尔 和 协 系数 计算 对 话 框 


步 驼 3: 将 对 话 框 左边 变量 表 列 中 的 “ksl,ks2,……ksl0" 变 量 全 部 置 人 右边 ”Test 
Variables” 下 面 的 方 框 中 ,然后 勾 选 对 话 框 上 的 "Kendall's WwW”。 单 击 “OK "按钮 即 可 输出 
结果 。 

步骤 4: 读 取 肯 德 尔 和 协 系 数 。 该 结果 输出 比较 简单 ,就 本 例 来 说 ,其 输出 的 结果 
如 表 7-8 所 示 , 由 该 表 可 知 ,5 名 考官 评分 的 一 致 性 肯 德 尔 和 协 系数 为 W =0. 889 ,其 
显著 性 水 平 p= 二 0.000 二 0.001, 达 到 了 极其 显著 性 的 水 平 ,说 明 考 官 评 分 有 具有 很 高 的 一 
致 性 。 


表 7-8 Test Statistics 







Kendall s W 
Chi-Square 
df 
Asymp,. Sig. 


a Kendall’s Coefficient of Concordance 





DL 藤 呆 滑 


DLL 酒 半 呈 艺 盖 艺 灯 疾 于 区 痛 训 





三 、 偏 相关 分 析 的 SPSS 过 程 :- 


还 是 利用 表 7 - 5 的 数据 来 说 明 偏 相关 系数 计算 的 SPSS 过 程 , 即 根据 表 7-5 中 20 
名 男 童 的 身高 .肺活量 .体重 三 方面 的 数据 资料 ,计算 控制 身高 之 后 肺活量 与 体重 的 偏 相 
关系 数 .控制 体重 之 后 肺活量 与 身高 的 偏 相关 系数 。 具 体 过 程 如 下 : 

步骤 1: 根 据 表 7 -5 中 各 个 变量 及 其 数据 形式 ,建立 正确 的 SPSS 数据 文件 。 该 文件 
应 该 是 20 行 、 三 列 ( 体 育成 绩 等 级 与 偏 相 关系 数 计算 无 关 , 此 处 不 列 人 ) ,三 列 变量 分 别 
是 身高 (定义 为 h) .肺活量 (定义 为 c) ,体重 (定义 为 w); 

步骤 2: 单 击 "Analyze” 菜 单 选择 “Correlate” 中 的 “Partial…"” 命 令 项 ,打开 对 话 框 ,如 
7- 10 所 示 ，; 


WW Part)al Corre}at 0n. 





7-10 义 相 关系 数 计算 对 话 杠 


步骤 3; 如 果 要 计算 控制 身高 之 后 肺活量 与 体重 的 偏 相关 系数 ,那么 选择 变量 c 和 w 
置 人 右 侧 “Variables” 下 的 方 框 中 .选择 变量 h 置信 “Controlling for” 下 面 的 方 框 中 , 单 击 
“OK”" 即 可 输出 偏 相 关系 数 。 此 例 中 得 到 r,. .= 二 0.703, 其 显著 性 水 平 p==0.001<=0. 01，。 

步骤 4: 如果 要 计算 控制 体重 之 后 肺活量 与 身高 的 偏 相关 系数 ,那么 选择 变量 h 和 
置 入 右 侧 “Variables* 下 的 方 框 中 ,选择 变量 w 置信“Controlling for" 下 面 的 方 框 中 , 单 击 
“OK” 即 可 输出 偏 相关 系数 。 此 例 中 得 到 m ,二 0.100, 其 显著 性 水 平 p 二 0. 684 二 0. 05 。 

从 本 例 输出 的 偏 相 关系 数 看 ,体重 与 肺活量 关系 很 密切 ,身高 与 肺活量 几乎 没有 任 
何 关联 性 。 


到 一 二 一 复习 思考 与 练习 题 二 人 一 jp 


1. 何谓 相关 和 线性 相关 ? 

2. 什么 是 积 差 相关 , 积 差 相 关 的 使 用 条 件 有 哪些 ? 

3. 假设 两 个 变 基 为 线性 关系 ,下 列 情况 下 计算 相关 时 ,应 该 分 别 选用 哪 种 方法 ? 
(1) 两 列 变量 是 等 距 或 等 比 的 数据 且 均 为 正 态 分 布 ; 

(2) 两 列 变量 是 等 距 或 等 比 的 数据 但 不 为 正 态 分 布 ; 


(3) 两 列 变量 为 等 级 变量 。 
4. 欲 考 察 甲 . 乙 两. 丁 四 人 对 10 件 工艺 作品 的 等 级 评定 结果 是 否 具有 一 致 性 ,需要 
a 一 种 相关 分 析 方 法 呢 ? 
. 随机 观测 15 名 高 一 学 生 在 语文 推理 测验 X 和 数学 考试 了 上 的 成 绩 (两 个 测验 的 
满分 均 为 100 分 ) ,如 表 7 - 9 所 示 。 试 计算 两 个 测验 分 数 之 间 的 相关 系数 并 进行 显著 性 
检验 。 


表 7-9 学 生 语 文 推理 测验 和 数学 考试 的 成 绩 





被 试 1 2 3 上 5 6 了 8 9 10 11 12 13 14 15 


Xx 31 23 40 19 60 15 16 26 32 30 58 28 22 23 “33 
76 60 81 56 90 50 85 68 80 73 87 70 58 60 82 





6. 抽取 10 名 高 三 学 生 参 加 测试 ,其 数学 测试 成 绩 及 自学 能 力 评价 等 级 如 表 7- 10 所 
示 ，, 试 分 析 两 项 测试 结果 之 间 的 相关 系数 并 进行 显著 性 检验 。 
表 7-10 学 生 数学 考试 成 绩 及 自学 能 力 评价 等 级 





学 生 编 号 1 2 3 4 5 6 7 8 9 10 
数学 考试 成 绩 90 84 76 71 71 71 69 68 66 64 
自 掌 能 力 评价 3 2 5 7 8 6 8 7 10 9 





7. 六 位 教师 各 自 评阅 5 篇 作文 ,独立 地 给 出 对 每 箱 作文 的 评价 等 级 ,如 表 7 -11 所 
示 。 试 计算 Kendall's W, 以 考察 评分 者 评分 的 一 致 性 水 平 。 | 
表 7-11 六 位 教师 对 五 篇 作文 的 评价 结果 


评分 者 
作文 

一 和 = 四 五 六 
一 3 3 3 3 3 3 
5 5 4 5 5 5 
三 2 2 1 1 2 2 
四 和 4 5 4 各 4 
五 1 1 2 2 1 1 





8, 借助 于 SPSS 系统 重新 对 例 7-1.7-3.7-4.7-5.7-6, 以 及 练习 题 第 5.6、?7 中 
的 数据 进行 分 析 。 


9 二 委 革 订 汶 古 若 上 并 
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第 八 章 聚 类 分 析 
Es 


聚 类 分 析 是 以 相关 分 析 为 基础 的 个 集 分 类 技术 和 变量 分 类 技术 , 它 强 调 以 完备 的 测 
评 指 标 体系 获取 较为 全 面 的 资料 ,在 多 维度 的 空间 中 测评 个 案 间 或 变量 间 的 "距离 ”, 遵 
循 距离 最 近 原 则 实现 聚 类 。 本 章 介绍 的 聚 类 分 析 方 法 包括 层次 聚 类 分 析 和 快速 聚 类 分 
析 两 大 类 ,其 中 层次 聚 类 分 析 又 可 分 为 针对 个 案 的 Q 聚 类 方法 和 针对 变量 的 R 聚 类 方 
法 ,而 快速 聚 类 分 析 适 用 于 大 样本 条 件 下 的 个 案 聚 类 。 在 聚 类 分 析 之 前 ,要 注意 对 变量 
值 的 性 质 进行 区 分 和 对 变量 量 纲 进行 调整 ,以 保证 "距离 "计算 的 可 靠 性 。 最 后 ,简明 地 
介绍 了 各 种 聚 类 分 析 的 SPSS 过 程 。 


“ 物 以 类 聚 , 人 以 群 分 ”, 科 学 研究 在 揭示 对 象 特点 及 其 相互 作用 的 过 程 中 ,不 惜 花费 
时 间 和 精力 进行 对 象 分 类 ,以 揭示 对 象 相同 和 不 同 的 特征 。 在 心理 学 研究 中 ,经 常 遇 到 
的 分 类 包括 两 种 情况 :一 是 对 研究 样本 或 个 案 的 分 类 , 即 根据 每 个 个 案 的 一 系列 观测 指 
标 , 将 观测 量 方 面 表 现 相 近 的 个 案 归 为 一 类 ,将 观测 量 方面 表现 很 不 相同 的 个 案 归 到 不 
同 的 类 , 即 对 观测 对 象 进行 分 类 ;二 是 对 测量 指标 的 分 类 ,即将 一 系列 的 观测 指标 归 类 合 
并 为 性 质 明 显 不 同 的 少数 几 个 方面 , 即 对 变量 进行 分 类 。 在 统计 学 中 ,分 类 又 叫 聚 类 
(classifying) 。 


第 一 节 聚 类 分 析 的 基础 


一 、 聚 类 分 析 的 基本 涵义 


事物 相似 或 不 相似 都 是 相对 的 ， 所 以 对 事物 进行 分 类 ， 实 际 上 是 根据 这 些 事物 某 
些 定性 的 或 定量 的 差异 进行 的 。 差 异性 越 小 越 有 可 能 被 认为 是 同一 类 ， 玉 之， 差异 性 
越 大 越 有 可 能 被 认为 是 不 同 的 类 。 事 物 间 的 定量 差异 是 聚 类 分 析 的 数学 基础 ， 定 性 卷 
异 则 是 聚 类 分 析 结 果 选 择 的 依据 ， 所 以 聚 类 分 析 是 定量 与 定性 研究 的 结合 。 要 使 用 统 
计 学 方法 对 事物 或 事物 属性 进行 分 类 ， 必 须要 有 一 系列 反映 这 些 事物 特征 的 变量 值 ， 
然后 依据 数理 方法 将 观测 对 象 或 所 测量 的 指标 进行 分 类 。 例 如 ， 在 教育 领域 ， 可 以 按 
照 各 高 校 在 基础 建设 、 教 研 条 件 、 师 资 队伍 、 科 学 研究 、 人 才 培 养 、 技 术 开 发 、 行 政 
管理 等 方面 的 情况 来 对 高 校 办 学 综合 实力 进行 评估 ， 获 得 一 系列 测量 数据 ， 然 后 采用 


统计 学 方法 将 这 些 高 校 分 类 。 比 如 可 以 分 成 科研 型 、 教 学 型 、 教 学 一 科研 型 三 类 ， 也 
可 以 分 成 办 学 水 平 高 的 、 中 等 的 、 较 差 的 三 类 。 做 这 样 的 分 类 有 利于 教育 行政 管理 部 
门 更 有 效 地 调配 资源 ， 促 进 高 等 教育 事业 的 整体 快速 发 展 。 再 比如 ， 在 医疗 领域 ， 可 
以 根据 病人 的 一 系列 症状 指标 ， 判 断 病 人 患 病 的 类 型 和 程度 ， 便 于 采用 有 针对 性 的 治 
疗 方案 。 


聚 类 分 析 是 一 种 数值 分 类 方法 , 它 是 将 分 类 对 象 置 于 一 个 多 维 空间 中 ,然后 按照 它 


们 的 亲 玖 远近 进行 分 类 。 所 以 它 需 要 基本 的 数据 资料 ,而 且 是 多 方面 的 数据 资料 ,按照 
较 专 业 的 术语 来 说 , 它 需 要 一 个 指标 体系 。 也 就 是 说 ,进行 聚 类 分 析 , 先 要 建立 由 某 些 事 
物 属性 构成 的 指标 体系 ,或 者 说 是 一 个 变量 组 合 。 入 选 的 每 个 指标 必须 能 刻画 事物 属性 
的 某 个 独特 侧面 ,所 有 指标 组 合 起 来 形成 一 个 完备 的 指标 体系 ,它们 互相 配合 可 以 共同 
刻画 事物 的 特征 。 所 谢 完备 的 指标 体系 ,是 说 入 选 的 指标 很 充分 ,其 他 任何 新 增 指标 对 
辨别 事物 差异 无 显著 性 页 献 。 如 果 所 选 指标 不 完备 , 则 容易 导致 分 类 偏差 。 比 如 要 对 家 
庭 教 养 方 式 进行 分 类 ,就 要 有 描述 家 庭 教育 方式 的 一 系列 变量 ,这 些 变量 能 够 充分 反映 
不 同 家 庭 对 子女 教养 方式 的 差异 性 。 


二 、 多 维度 空间 中 距离 的 测量 


我 们 很 容易 理解 ,在 几何 空间 中 ,如 时 若干 坐标 点 之 间 的 距离 很 小 ,它们 就 会 聚集 在 
一 起 。 如 果 出 现 几 个 不 同 的 坐标 点 的 聚集 区 ,我 们 就 会 把 这 些 坐 标点 看 成 相对 不 同 的 几 
个 部 分 或 几 个 类 。 而 且 , 空 间 维度 越 低 , 距 离 的 计算 越 容易 ,也 更 容易 理解 ,如 图 8- 1 标 
识 出 了 一 维 ,二 维和 三 维 坐标 系 中 点 的 距离 。 





两 点 距离 平方 =A 两 点 距离 平方 =Axa+AW 两 点 距离 平方 = 人 x 人 A+ 人 人 22 


图 8-1 不 同 维度 数 坐 标 系 中 点 距离 的 计算 

如 果 用 a 表示 两 点 间 的 距离 ,那么 如 图 8 -1 的 a.b、c 所 示 , 要 计算 第 i 和 第 j 个 点 
间距 离 的 方法 ,在 一 维 、 二 维 ,、 三 维 坐 标 系 中 是 一 样 的 。 

一 维 坐 标 系 中 两 点 距离 :dj 二 VAz’ == V(x 一 Xj)* 

二 维 坐 标 系 中 两 点 距离 :d; 二 VArT 下 Ay = V(z 一 二 (yy 一 yj)™ 

三 维 坐 标 系 中 两 点 距离 :dj = VAz 十 Ay 十 Az™ 
(zi—0) yO) 

不 过 ,在 聚 类 分 析 中 ,距离 的 概念 具有 了 更 一 般 的 意义 。 它 主要 是 从 相似 性 和 不 相 
似 性 的 角度 来 说 的 ,也 就 是 所 谓 的 距离 相关 (distance correlation)。 这 里 的 距离 是 广义 距 
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离 ,包括 一 般 的 距离 和 相似 性 系数 两 种 类 型 了 。 它 是 根据 一 系列 的 测量 体系 ,计算 个 案 之 
间 的 距离 ,类似 于 上 述 的 几何 空间 距离 的 计算 方法 。 此 算法 来 自 于 古 希 腊 著 名 数学 家 欧 
几 里 德 的 几何 学 ,所 以 也 叫做 欧 氏 距离 ;计算 这 些 观测 指标 之 间 的 相似 性 ,也 就 是 计算 其 
相关 系数 ,被 称 为 是 相似 性 系数 。 

所 以 聚 类 分 析 中 的 距离 测量 ,包括 两 种 类 型 :距离 .相似 性 系数 。 

1 . 烹 硫 

如 果 将 上 述 几 何 空间 点 距 的 计算 方法 扩展 到 m 维 坐 标 系 中 ,那么 该 坐标 系 中 第 i 和 
第 7 个 点 的 坐标 可 以 表示 为 公式 8-1 的 形式 。 





al 
本 
Md (公式 8-1) 








ny 


对 被 观测 的 个 案 进 行 m 个 方面 的 测量 ,然后 依据 这 些 测量 结果 对 观测 个 案 进 行 分 
类 ,就 类 似 于 我 们 将 这 些 个 案 置 于 m 维 坐 标 系 中 ,对 其 分 类 的 依据 就 是 这 些 个 案 在 m 维 
坐标 系 中 的 距离 。 距 离 的 计算 要 分 两 种 情况 ;观测 指标 是 连续 变化 的 ;观测 指标 是 非 连 
续 变 化 的 。 

如 果 观 测 值 都 是 连续 变化 的 数值 , 则 主要 可 以 采用 欧 氏 距离 算法 ,其 计算 公式 就 是 : 


do= | >)(xzs — xn) (公式 8-2) 
k=l 


欧 氏 距离 是 聚 类 分 析 中 最 为 常用 的 距离 计算 方法 ,但 计算 量 相 对 较 大 。 所 以 这 里 再 
介绍 两 种 也 较为 常用 但 不 是 很 精确 的 计算 方法 :绝对 值 距 离 和 切 比 雪夫 距离 。 
绝对 值 距离 也 称 为 Manhattan 距离 ,是 以 空间 两 点 各 维度 指标 间 差 值 的 绝对 值 之 和 
为 其 计算 值 , 计 算 公 式 为 : 
d; = > [天 一 | (公式 8-3) 
切 比 当 夫 距离 取 空 间 两 点 mr 个 指标 的 差 值 中 绝对 值 最 大 的 那 一 个 作为 距离 计算 值 ， 
公式 为 : . 
ds —max| xa — x | (公式 8 -4) 
对 于 非 连续 变化 的 变量 , 则 需要 采用 x 他 方法 。 我 们 在 后 续 章节 中 需要 
用 到 这 种 方法 时 不 再 给 出 具体 计算 公式 ,但 会 在 聚 类 分 SS 过 程 中 ,说明 何 种 情况 
下 选择 使 用 这 些 方法 。 
2. 入 似 烽 系 汶 
相似 性 系数 是 描述 测量 指标 之 间 亲 疏 程 度 的 指标 ,其 取 值 范围 是 {一 1 十 1}。 只 有 
当 两 个 指标 的 每 一 对 应 值 之 比 为 同一 个 常数 时 , 才 会 出 现 极端 值 一 1 或 十 1， 
相似 性 系数 的 计算 方法 也 很 多 ,最 常用 的 是 计算 积 差 相关 系数 。 
假如 在 容量 为 n 的 样本 中 ,对 指标 体系 进行 测评 ,得 到 每 一 个 案 的 m 项 指标 测量 值 ， 
那么 对 于 指标 Y, 和 Y 来 说 ,测量 值 可 以 表示 为 ， 
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| | 
一 22 Y ,一 4 (公式 8-5) 


Yn | Yn 


两 个 测量 指标 分 别 具 有 了 一 组 数据 ,并 且 这 两 组 数据 是 一 一 对 应 的 ,所 以 最 直接 的 
方法 就 是 利用 积 差 相关 计算 它们 之 间 的 相似 性 系数 。 当 然 , 积 差 相 关 计 算 要 求 两 组 数据 
是 连续 变化 或 可 以 近似 地 看 作 连 续 变化 的 数据 资料 。 

在 不 同 条 件 下 ,可 以 选用 其 他 相似 性 系数 的 计算 方法 - 这 里 不 再 介绍 。 

聚 类 分 析 中 ,描写 被 分 类 事物 间 关 系 亲 牙 程 度 的 各 种 指标 ,无 论 是 距离 还 是 相似 性 
系数 ,都 必须 是 定义 合理 ,计算 简便 的 ,要 能 突出 事物 间 的 主要 差异 性 了 。 选 择 指标 时 还 
要 与 聚 类 分 析 的 目的 相 适应 。 测 度 指标 不 同 ,反映 事物 间 的 差异 性 也 不 同 , 聚 类 分 析 的 
结果 也 不 会 是 完全 相同 的 。 所 以 应 该 慎重 选择 距离 或 相似 性 系数 指标 ,使 分 类 尽 基 合理 
或 符合 实际 。 


三 、 测 量 指标 的 量 纲 调整 


聚 类 分 析 所 依赖 的 指标 体系 ,往往 是 一 些 性 质 不 同 的 变量 ,它们 的 测量 系统 或 测 
量 单位 可 能 都 不 一 样 ,常常 就 会 出 现 不 同 数 量 级 的 数据 。 我 们 把 这 样 的 情况 叫做 数据 
的 量 纲 不 一 致 ,也 即 数量 级 的 大 小 不 一 样 。 数 量 级 差异 所 带 来 的 直接 后 果 就 是 :各 变 
量 在 个 案 间 距离 的 计算 中 所 起 作用 不 一 样 ,容易 导致 分 类 偏差 。 举 例 来 说 ,在 一 项 实 
验 中 ,记录 被 试 的 正确 率 和 反应 时 ,正确 率 以 百分数 来 表示 ,测量 结果 的 分 布 范 围 在 





0.65 一 0.98; 反 应 时 间 以 毫秒 单位 计 , 测 量 结果 的 分 布 范围 在 216ms 一 450ms。 如 果 我 们 ， 


用 欧 氏 距离 来 计算 两 个 个 案 间 的 亲疏 程度 , 则 可 以 将 其 距离 表示 成 如 下 的 形式 :d; = 
Vp 一 Pp,)Y 下 (4 一 t;)*。 很 明显 ,在 这 个 算式 中 ,(p; 一 p;)* 的 数量 级 是 在 小 于 1. 00 的 范 
围 内 的 小 数 ; (4 一 0) 的 数量 级 可 能 会 达到 以 万 计 。 这 两 项 相 加 时 ,前 一 项 几乎 难以 起 
到 作用 , 它 在 结果 中 可 以 忽略 不 计 ; 该 距离 的 计算 实际 上 只 大 由 反应 时 间 一 项 决定 的 ,为 
了 综合 地 考虑 两 项 测试 结果 来 计算 距离 ,就 需要 将 两 项 指标 的 量 纲 调整 到 基本 一 致 . 常 
用 的 方法 有 以 下 几 种 @。 


(一 ) 数据 中 心 化 变换 
如 果 数 据 量 纲 的 不 一 致 是 由 各 自 的 分 布 中 心 大 小 差异 造成 的 , 则 可 对 各 组 数据 作 中 
心 化 变换 ,即将 数据 转换 为 其 离 差 值 , 因 为 所 有 变量 的 离 差 值 的 分 布 中 心 均 为 0。 中 心 化 
的 计算 公式 是 : 
Tu 一 工 x 一 元 (公式 8-6) 


(二 ) 数据 标准 化 变换 
如 果 数 据 量 纲 不 一 致 是 由 各 自 的 方差 有 显著 性 差异 导致 的 , 则 可 对 数据 作 标准 化 处 
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理 , 即 转化 为 标准 = 分 数 。 转 换 公 式 是 : 


x = {公式 有 一 7 


(三 ) 极 差 正规 化 变换 
极 差 正规 化 变换 是 将 各 组 数据 均 变换 为 以 原 数据 最 小 数 为 0 点、 以 原 数据 全 距 为 单 
位 的 一 组 小 数值 。 也 就 是 说 ,经 过 了 极 差 正规 化 转换 后 ,分 数 的 范围 在 0 一 1 之 间 。 原 来 
最 小 的 数 转换 为 0, 原来 最 大 的 数 转 换 为 1。 转换 的 计算 公式 是 : 
Xa — min{xa} 


SE i 入 地 i 
Sr Fh er ey ph (公式 8-8) 


(四 ) 对 数 变 换 

呈现 出 指数 函数 特征 的 数据 不 能 直接 与 其 他 数据 一 起 参与 聚 类 分 析 ,必须 先 要 对 其 
进行 对 数 变换 ,变换 的 公式 是 
| xue 一 logzs (公式 8-9) 

原来 具有 指数 函数 特征 的 数据 经 过 对 数 变换 后 就 会 呈现 出 线性 特征 ,可 以 参与 聚 类 
分 析 。 但 在 转换 之 前 ,要 注意 判断 数据 特征 。 如 果 不 是 对 数 特征 而 对 其 进行 了 对 数 变 
换 ,不 仅 未 能 达到 调整 数据 的 目的 ,反倒 带 来 新 的 错误 。 

由 于 聚 类 对 象 .测量 的 指标 体系 .数据 性 质 的 不 同 , 聚 类 分 析 所 采取 的 操作 手段 也 会 
不 同 。 实 际 计算 过 程 ,尤其 是 距离 及 相似 性 系数 计算 方法 的 选择 ,很 不 相同 。 聚 类 分 析 


. 通常 分 为 层次 聚 类 分 析 (Hierarchical Cluster) 和 快速 聚 类 分 析 (K-Means Cluster) 两 大 


类 ,其 中 层次 聚 类 分 析 又 可 划分 为 针对 个 案 的 Q 聚 类 分 析 和 针对 观测 指标 的 RR 聚 类 分 
析 。 后 续 各 节 分 别 介绍 Q 聚 类 分 析 、R 聚 类 分 析 和 快速 取 类 分 析 的 基本 逻辑 .一般 过 程 
和 计算 方法 。 


第 二 节 ”层次 聚 类 分 析 


层次 聚 类 分 析 的 还 辑 过 程 是 :根据 一 个 完备 的 指标 体系 ,对 观测 对 象 即 个 案 或 观测 
指标 进行 聚 类 。 它 不 仅 要 计算 单个 个 案 间 或 变量 间 的 距离 .而且 要 计算 小 类 与 个 案 或 单 
个 变量 、 小 类 与 小 类 之 间 的 距离 。 通 常 是 把 观测 样本 中 的 每 一 个 案 或 指标 体系 中 的 每 一 
变量 看 作 是 一 个 独立 的 小 类 ,计算 它们 所 有 的 两 两 之 间 的 距离 ,在 比较 这 些 距离 后 把 距 
离 最 小 的 两 个 聚 为 一 个 小 类 。 然 后 计算 这 个 新 类 与 其 他 各 类 之 间 的 距离 ,再 把 其 中 距离 
最 小 的 聚 为 一 类 ,如 此 不 断 地 进行 下 去 ,直到 所 有 个 体 或 所 有 变量 聚 为 一 个 大 类 为 止 。 
所 以 ,层次 聚 类 方法 是 一 个 由 多 到 少 的 聚 类 过 程 , 它 不 仅 可 以 将 个 案 或 单个 变量 分 为 若 
干 类 ,而 且 可 以 形成 一 个 类 属 间 的 层次 关系 ,还 可 以 依据 分 类 的 过 程 绘制 个 体 或 变量 的 
谱系 关系 图 。 

前 文 所 述 的 距离 及 其 计算 方法 是 聚 类 分 析 的 基础 ,也 是 聚 类 分 析 的 前 期 阶段 。 下 
面 ,我 们 以 Q 聚 类 分 析 为 例 来 说 明 层 次 聚 类 分 析 的 一 般 过 程 。 


步骤 1: 完备 的 指标 体系 及 其 数据 的 获取 

研究 对 其 进行 分 类 的 事物 的 主要 特征 ,并 考虑 分 类 的 主要 目的 ,选择 恰当 的 一 系列 
观测 变量 构成 一 个 完备 的 指标 体系 。 对 抽取 来 的 所 有 样本 或 个 案 进行 观测 ,取得 各 个 指 
标的 数据 列 。 如 图 8 - 2 所 示 的 数据 和 矩阵 中 :样本 容量 为 nn, 指标 体系 有 m 个 变量 。 


个 案 号 指标 1 指标 2 二 指标 严 


1 Tl Tl Woe Tm] 


2 Tl: Tr 9 Tu 





图 8-~2 样本 观测 数据 的 矩阵 图 


步 又 2: 距离 计算 与 逐步 雍 聚 

根据 变量 的 数据 性 质 与 类 型 ,选用 恰当 的 距离 计算 方法 ,计算 个 案 之 间 、 小 类 之 间 的 
距离 ,依照 距离 最 近 原则 逐步 聚 类 。 距 离 计算 之 前 要 对 数据 进行 整理 ,尽量 做 到 数 
量 网 一 致 。 常 用 的 个 案 间 距离 的 计算 方法 及 其 选用 条 件 是 ， 

(1) 如 果 作 为 聚 类 分 析 基 础 的 变量 均 为 连续 变化 的 ,可 以 选用 欧 或 欧 氏 距离 
平方 .绝对 值 距离 , 切 比 雪夫 距离 等 , 尤 以 欧 氏 距离 使 用 最 多 ; 

(2) 如 果 变 量 中 有 顺序 变量 ,等 级 变量 , 则 宜 选 用 x 其 他 方法 ; 

(3) 如 量 中 有 二 分 变量 ,多 以 0,.1 两 种 变量 值 记 录 结 果 的 变量 ,这 时 可 使 用 二 

em 此 处 不 对 之 做 过 多 介绍 ,在 使 用 SPSS 进行 聚 类 分 析 中 ,可 根据 需要 设 

帝 这 些 方法 。 

个 案 两 两 间 的 距离 计算 完成 后 ,距离 最 近 的 两 个 个 案 聚 合 在 一 起 会 形成 一 个 小 类 ， 
接 下 来 还 要 继续 计算 剩余 的 个 案 与 已 聚 成 的 小 类 、 小 类 与 小 类 之 间 的 距离 ,该 计算 贯穿 
在 聚 类 分 析 的 整个 过 程 中 ,直到 所 有 个 案 汇 聚 在 一 起 形成 一 个 大 类 为 止 。 个 案 与 小 类 、 
小 类 与 小 类 之 间距 离 的 计算 方法 主要 有 以 下 儿 种 : 

(1) 最 短 距离 法 (Nearest Neighbor) 。 以 某 一 个 案 与 小 类 中 各 个 案 之 间距 离 中 的 最 
小 值 作为 该 个 案 与 这 一 小 类 之 间 的 距离 。 

(2) 最 长 距离 法 (Furthest Neighbor)。 以 某 一 个 案 与 小 类 中 各 个 案 之 间距 离 中 的 
最 大 值 作为 该 个 案 与 这 一 小 类 之 间 的 距离 。 

(3) 类 间 平 均 连锁 法 (Between-groups Linkage)。 将 两 个 小 类 之 间 的 所 有 个 案 间 的 
距离 计算 出 来 ,再 计算 这 些 距离 的 平均 值 。 这 是 SPSS 默认 的 距离 的 计算 方法 。 

(4) 重心 法 (Centroid Clustering)。 先 确定 两 个 小 类 各 自 的 重心 坐标 ,然后 计算 这 
两 个 重心 之 间 的 距离 作为 两 个 小 类 之 间 的 距离 。 

计算 出 小 类 之 间 的 距离 后 ,一 般 也 是 采用 最 近 距 离 方法 进行 小 类 聚合 。 层 层 推进 ， 
完成 聚 类 分 析 , 也 正好 形成 一 个 有 层次 的 类 属 关系 。 也 正 因为 如 此 ,这 一 过 程 叫 做 层次 
聚 类 分 析 。 

步骤 3 :绘制 凝聚 状态 圾 、 树 形 图 和 冰 柱 图 

聚 类 过 程 实际 上 是 伴随 着 距离 计算 过 程 而 发 生 和 完成 的 ,如 果 将 这 一 过 程 表示 成 表 
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格 的 形式 ,就 叫做 凝聚 状态 表 (Agglomeration Schedule) ;如果 将 这 一 过 程 表示 成 图 形 的 
形式 , 则 可 以 使 用 树 形 图 和 冰 柱 图 。 
例如 ,根据 某 一 观测 指标 体系 对 6 个 个 体 进行 聚 类 分 析 。 已 知 指标 体系 中 的 变量 均 
为 连续 变化 的 数据 。 所 以 采用 欧 氏 距离 测量 个 体 与 个 体 之 间 、 小 类 与 小 类 之 间 的 距离 。 
最 先 计 算出 来 的 个 案 间 距离 矩阵 如 表 8 - 1 所 示 。 
表 8-1 初始 的 个 案 间 距离 矩阵 


G(3) G(4) G(5) G(6) 





依据 距离 最 近 原 则 ,个 案 1 与 个 案 2 首先 聚合 在 一 起 形成 小 类 G(1 ,2) ,再 以 该 小 类 、 
其 他 四 个 个 体 间距 计算 距离 矩阵 ,小 类 间或 小 类 与 个 体 间距 离 采用 平均 连锁 法 计算 距 
离 。 如 表 8- 2 所 示 。 


表 8-2 第 二 轮 计 算得 到 的 个 案 间 或 小 类 间距 离 矩 阵 


G(3) G{4) G5) 
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根据 表 8 -2 所 示 的 距离 矩阵 ,个 案 4 与 个 案 5 聚合 在 一 起 形成 小 类 G(4,5)。 再 以 
两 个 小 类 .两 个 个 案 计 算 距 离 矩 阵 , 如 表 8 - 3 所 示 。 


表 8-3 第 三 轮 计 算 的 距离 矩阵 表 8-4 两 个 小 类 间 的 距离 


G(3) G(4,5) G6) G(4,.5,.6) 


G(1,2,3) 7 





根据 表 8 -3 所 示 的 距离 矩阵 ,个 案 3 与 小 类 G(1,2) 聚 合 在 一 起 形成 小 类 G(1,2， 
3) ,个 案 6 与 小 类 G(4,5) 聚 合 在 一 起 形成 小 类 G(4,5,6)。 再 计算 小 类 间 的 距离 ,如 表 
8 一 4 所 示 。 

最 后 根据 表 8 -4 的 距离 ,将 小 类 G(1,2,3) 与 G(4,5,6) 聚 合成 一 个 大 类 。 

这 一 聚 类 的 过 程 可 以 表示 成 数据 表格 的 形式 ,如 表 8 - 5 所 示 , 该 表格 显示 了 整个 聚 
类 过 程 中 个 体 是 如 何 凝 聚 成 小 类 ,小 类 又 如 何 参 与 聚合 ,直到 最 后 所 有 个 体 族 聚 成 一 个 









表 8-5 聚 类 过 程 的 凝聚 状态 表 
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表 8-5 所 显示 的 凝聚 过 程 是 :第 一 阶段 ,个 案 1 和 个 案 2 凝聚 成 一 个 小 类 ;第 二 阶 
段 , 个 案 4 和 个 案 5 凝聚 成 一 个 小 类 :第 三 阶段 ,个 案 3 与 第 一 阶段 形成 的 小 类 凝聚 一 个 
小 类 ;第 四 阶段 ,个 案 6 与 第 二 阶段 形成 的 小 类 凝聚 :第 五 阶段 ,第 三 步 和 第 四 步 凝 聚 成 
的 两 个 小 类 凝聚 成 一 个 大 类 。 

如 果 将 上 述 聚 类 过 程 表示 成 树 形 图 的 形式 , 则 如 图 8 - 3 所 示 ， 该 图 比 凝聚 状态 表 能 
更 直观 地 显示 聚 类 的 过 程 和 聚合 小 类 之 间 的 距离 。 





图 8-~3 平均 连锁 法 桶 类 的 谱系 图 { 树 形 图 ) 图 8-~4 平均 连锁 法 聚 类 分 析 的 冰 柱 图 


步骤 4: 确定 类 别 数 和 个 体 的 类 届 关 系 

形成 了 聚 类 的 谱系 图 之 后 ,研究 者 还 要 确定 最 后 的 类 别 数 。 确 定 类 别 数 往往 要 结合 
专业 知识 ,常用 的 方法 有 两 种 :一 是 根据 某 些 要 求 或 相关 的 信息 ,确定 分 类 的 类 别 数 , 然 
后 确定 每 一 个 案 所 属 类 别 ; 二 是 在 谱系 图 上 确定 一 个 距离 的 截 点 值 , 将 谱系 图 分 为 左右 
两 部 分 ,左边 所 有 的 类 合并 都 被 认可 ， 在 入 A - 但 










不 管 采用 什么 方法 确定 类 别 数 ,最 终 的 类 别 数 
差异 相 比 ， 关 间 差异 要 显著 的 大 ,其 次 所 分 出 的 各 类 都 具有 实际 的 意义 ， 比较 容易 概括 类 
中 个 体 的 特点 :最 后 , 若 采 用 不 同 的 聚 类 分 析 方法 ,所 得 结果 应 比较 接近 。 不 管 采用 哪 种 
方法 ,所 分 各 类 之 间 的 差异 应 该 比较 明显 ,而 类 内 个 案 之 间 应 该 较为 相似 。 





第 三 节 ”快速 聚 类 分 析 


层次 聚 类 分 析 是 比较 符合 事物 的 层次 关系 逻辑 的 ,在 实际 研究 中 应 用 广泛 。 但 是 当 
样本 数 太 大 的 时 候 ,其 计算 量 非常 巨大 ,即使 用 计算 机 运算 .也 会 造成 某 些 配置 相对 较 低 
的 计算 机 资源 不 够 ,此 时 需要 用 到 快速 聚 类 分 析 。 由 于 运用 该 方法 得 到 的 结果 比较 简单 
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易 慌 ,可 以 省 略 大 量 的 计算 过 程 ,所 以 应 用 也 比较 广泛 。 不 过 需要 指出 的 是 :快速 聚 类 分 
析 只 适用 于 对 个 案 的 聚 类 ,而 不 适用 于 对 变量 的 聚 类 。 


一 、 快 速 聚 类 分 析 的 基本 过 程 


快速 聚 类 分 析 中 的 距离 计算 与 层次 聚 类 分 析 中 的 算法 是 一 样 的 ,也 要 根据 变量 或 变 
量 值 的 性 质 选 择 相应 的 算法 。 比 如 ,如 果 变 量 都 是 连续 变化 的 , 则 多 用 欧 氏 距离 或 欧 氏 
距离 平方 ;如 果 指 标 体系 中 包含 顺序 变量 ,等 级 变量 , 称 名 变量 , 则 可 以 使 用 x 算法 :如 
果 指 标 体系 是 二 项 记分 变量 (只 以 0,1 为 变量 值 ), 则 使 用 二 元 欧 平方 。 这 里 不 再 
重复 各 种 距离 算法 ,只 重点 介绍 快速 聚 类 分 析 的 多 辑 顺序 。 

步骤 1 :规定 类 别 数 和 初始 的 类 中 心 点 坐标 

在 进行 大 样本 的 调查 研究 过 程 中 ,研究 者 对 研究 对 象 有 一 定 程度 的 了 解 ,也 会 有 一 
些 研究 假设 ,包括 对 被 试 分 类 数 的 假设 。 为 了 节省 计算 过 程 ,研究 者 可 以 结合 相关 资料 
的 分 析 ,规定 聚 类 数 。 然 后 ,给 出 各 个 假设 类 别 的 中 心 点 坐标 。 在 SPSS 过 程 中 ,可 由 计 
算 机 自动 根据 观测 值 设 定 初始 的 类 中 心 点 坐标 。 

比如 ,我 们 要 根据 一 个 包含 5 个 观测 变量 的 指标 体系 对 200 个 样本 进行 快速 聚 类 。 先 
设 定 一 个 分 类 数 4, 即 准备 按 四 类 将 200 名 被 试 分 组 ,当然 期 望 四 组 之 间 的 差别 会 比较 明 
显 。 那 就 需要 根据 样本 中 观测 值 的 分 布 情况 , 先 假定 四 个 类 的 中 心 点 坐标 ,如 图 8-5 所 示 。 
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8-5 假定 的 四 个 美 中 心 点 坐标 


步骤 2: 计 算 各 个 样本 到 所 有 类 中 心 点 的 距离 

有 了 若干 个 类 中 心 点 坐标 之 后 ,就 可 以 选用 恰当 的 距离 算法 ,计算 每 一 个 样本 到 所 
有 类 中 心 点 的 距离 。 就 我 们 假定 的 例子 来 说 ,有 200 个 样本 (每 个 样本 也 有 四 项 观测 值 
为 其 坐标 ) .四 个 类 中 心 点 坐标 ,就 需要 分 别 计 算 200 个 样本 各 自 到 四 个 中 心 点 的 距离 ， 
即 要 计算 出 800 个 距离 。 

步骤 3: 完 成 第 一 次 归 类 过 程 (也 叫 第 一 次 只 代 过 程 ) 

根据 距离 最 近 原 则 ,每 一 个 样本 都 进入 到 初始 中 心 点 离 它 最 近 的 那个 类 ,完成 第 一 
次 分 类 ,形成 上 个 新 类 ,这 就 叫 作 完成 第 一 次 选 代 。 就 我 们 所 举例 子 来 说 ,200 个 样本 中 
的 每 一 个 样本 与 四 个 初始 中 心 点 的 距离 都 计算 出 来 之 后 ,看 其 到 哪个 中 心 点 距离 最 小 ， 
这 个 样本 就 被 暂时 归 人 到 这 一 类 ,最 后 200 个 样本 暂时 归 人 到 了 四 个 类 。 

步 又 4: 重 新 计算 所 形成 的 各 个 新 类 的 中 心 点 坐标 

第 一 次 迭代 完成 后 ,所 有 样本 都 暂时 被 归 入 到 某 一 类 ,因此 某 一 类 也 都 包含 了 若干 
个 样本 。 因 为 各 类 中 的 样本 的 坐标 都 是 确定 的 ,所 以 现在 就 可 以 根据 其 中 各 个 样本 的 观 
测 值 即 坐 标 重新 计算 类 中 心 点 坐标 ,形成 个 新 的 中 心 点 坐标 。 如 果 这 些 中 心 点 坐标 正 
好 与 初始 的 中 心 点 坐标 重合 , 则 说 明 各 个 样本 进入 的 类 别 合 适 , 即 可 结束 聚 类 过 程 ;如 果 
新 的 中 心 点 与 初始 的 中 心 点 不 重合 ,发 生 了 移 位 , 那 就 意味 着 第 一 次 迭代 需 调 整 , 有 些 样 


本 可 能 需要 重新 归 类 ,需要 继续 计算 和 选 代 。 

步骤 5: 再 一 次 计算 各 样本 到 所 有 中 心 点 距离 并 完成 第 二 次 迭代 

有 了 卡 个 新 的 中 心 点 坐标 之 后 ,再 重新 计算 各 个 样本 到 所 有 新 的 中 心 点 的 距离 , 然 
后 根据 距离 最 小 原则 ,重新 归 类 ,完成 第 二 次 迭代 , 即 得 到 新 的 分 类 结果 ， 

上 述 过 程 可 重复 进行 ,直到 某 一 次 迭代 过 程 中 ,形成 的 新 类 不 再 需要 调整 为 止 。 这 
时 就 可 以 得 到 聚 类 的 最 后 结果 。 


二 、 快 速 聚 类 分 析 的 结果 及 其 检验 


快速 聚 类 分 析 过 程 完 成 后 ,还 需要 确认 聚 类 分 析 的 结果 是 否 合适 。 一 个 衡量 的 标准 
就 是 从 定性 和 定量 两 个 方面 ,各 类 之 间 的 样本 应 该 差异 明显 、 各 类 之 内 的 样本 应 该 较为 
相似 ， 所 以 ,除了 可 借助 于 专业 知识 对 各 类 中 的 样本 进行 定性 分 析 , 以 鉴别 异同 外 ,还 可 
以 用 方差 分 析 进 行 检验 。 

方差 分 析 的 过 程 是 :在 接受 分 类 结果 的 前 提 下 ,分 类 变量 就 成 了 一 个 分 组 变量 , 它 将 
样本 划分 成 了 上 个 独立 组 ,以 分 类 变量 为 自 变 量 ,就 可 以 对 所 有 的 观测 变量 进行 单 因素 
的 方差 分 析 。 如 果 所 有 的 或 绝 大 部 分 的 观测 变量 都 存在 显著 性 差异 ,说 明 分 类 有 效 , 结 
果 可 以 接受 ;如 果 观 测 变量 中 的 多 数 差异 不 显著 ,可 能 意味 着 初始 规定 的 分 类 数 可 能 不 
合适 ,可 以 尝试 其 他 的 分 类 数 , 重 新 开始 聚 类 过 程 。 

另外 ,各 类 中 所 拥有 的 个 案 数 是 否 较为 均衡 也 是 衡量 聚 类 结果 优 差 的 一 个 标准 ， 

在 确认 了 分 类 结果 之 后 ,一 般 要 呈现 下 列 信息 或 聚 类 结果 :(1) 初 始 的 类 中 心 点 坐 
标 ;(2) 迁 代 过 程 , 即 进行 几 次 迭代 ,以 及 每 次 迭代 的 坐标 调整 距离 和 各 个 类 中 心 点 之 间 
的 距离 ;(3) 样 本 归属 情况 , 即 每 一 个 样本 被 划分 到 哪 一 类 、 各 个 样本 到 所 在 类 中 心 点 的 
距离 .各 类 中 的 样本 数量 各 是 多 少 等 等 ;(4) 方 差分 析 结 果 , 即 以 分 类 变量 为 自 变量 ,以 聚 
类 所 依据 的 指标 体系 中 的 所 有 观测 变量 为 因 变量 进行 方差 分 析 , 给 出 方差 分 析 表 ,以 说 
明 各 类 间 的 定量 差异 性 。 是 


第 四 节 聚 类 分 析 的 SPSS 过 程 


聚 类 分 析 过 程 往往 有 很 大 的 计算 量 ,现在 一 般 都 是 通过 计算 机 软件 来 完成 ,特别 是 
SPSS 软件 系统 能 够 很 快捷 地 完成 较 大 数据 样本 的 聚 类 分 析 过 程 。 


一 、 层 次 聚 类 分 析 的 SPSS 过 程 


层次 聚 类 分 析 包 括 了 Q 型 的 聚 类 分 析 和 R 型 的 聚 类 分 析 ,我 们 结合 具体 实例 ,只 以 
Q 聚 类 来 说 明 层 次 聚 类 分 析 的 SPSS 过 程 。 

【 例 8 - 1】 某 教 育 研究 者 根据 相关 数据 欲 对 北京 地 区 18 区 县 中 职 教育 发 展 进行 分 
类 研究 。 调 研 得 到 的 资料 主要 包括 :每 万 人 的 中 职 在 校生 数 .每 万 人 的 中 职 招生 数 、 每 万 
人 的 中 职 毕 业 生 数 .每 万 人 的 中 职 专任 教师 数 .专任 教师 中 本 科 以 上 学 历 者 占 的 比例 、 专 
任教 师 中 高 级 职称 者 占 的 比例 ,学校 平 均 在 校生 人 数 . 中 职 发 展 预算 经 费 占 生 产 总 值 的 
比例 . 生 均 教育 经 费 等 ,如 表 8-4 所 示 。 





表 8$-6 某 一 时 段 北京 18 区 县 中 职 教育 发 展 状况 调查 数据 0 眉 





















区 其 I Ty Xs be, Xs Ty rs Xn 
东 城 156 53 45 15 0.507 0.245 701 0.0109 5356 
西 城 ” 119 12 31 13 0.502 0.331 552 0.0063 6449 
内 文 202 72 57 16 0.566 0.193 633 0.0168 5357 
家 起 176 57 31 17 0.630 0.234 584 0.0155 6432 
朝 阳 22] 77 45 17 0.499 0.254 553 0.0228 6625 
海淀 169 64 42 13 0.573 0.183 573 0.0048 5840 
上 EE 台 166 66 48 15 0.444 0.142 465 0.0112 5532 
石景山 192 61 52 19 0.524 0.085 535 0.0158 5695 
门头沟 ”127 53 8 30 0.143 0.026 376 0.0057 3904 
房 山 115 38 25 I0 0.571 0.127 618 10.0061 7020 
上 平 232 80 66 19 0.531 0.106 491 0.0072 5089 
顺 义 67 35 17 5 0.341 0.079 403 0.0006 3056 
通 县 98 40 25 7 0.533 0.107 474 0.0031 5559 
大 兴 205 76 67 16 0.597 0.129 616 0.0107 4990 
平 和 谷 8]1 39 2] 7 0.192 0.030 533 0.0007 2518 
怀 和 柔 ”121 52 27 l2 0.223 0.076 637 0.0023 4149 
， {1 22 6 0.558 0.091 618 0.0043 4376 
统 类 庆 78 31 23 5 0.366 0.070 424 0.0039 4677 
计 
二 【 解 】 本 例 中 ,18 个 区 县 就 作为 18 个 样本 看 待 ,对 其 中 职 教育 发 展 状况 的 调查 指标 
BP ”体系 包含 了 9 个 变量 ,分 别 为 zx;，… ,zs。 采 用 Q 型 聚 类 分 析 , 其 SPSS 过 程 主要 包括 
2 以 下 步骤 : 
和 步骤 1: 数 据 文件 的 建立 
加 建立 的 SPSS 数据 文件 由 18 行 .10 列 组 成 ,其 中 18 行 对 应 于 18 个 个 案 , 有 9 列 对 应 
于 表 中 的 9 项 调查 数据 ,另外 还 有 一 列 是 作为 个 案 标识 变量 。 如 表 8 - 6 所 示 。 
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图 8~6 层次 聚 美 分析 的 数据 文件 与 菜单 示意 图 


由 杨 晓 胃 :SPSS 在 教育 统计 中 的 应 用 ?, 高 等 教育 出 版 社 ,2004 年 版 
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步骤 2: 打 开 主 对 话 框 并 完成 相应 的 设置 
单 击 *Analyze” 菜 单 选择 “Classify" 中 的 “Hierarchical Cluster...” 命令 ,如 图 8-6 所 
示 ,打开 展 次 聚 类 分 析 的 主 对 话 框 ,如 图 8-7 所 示 。， 
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图 8-7 层次 桶 类 分 析 的 主 对 话 框 
在 如 图 8 -7 所 示 的 对 话 框 中 ,从 左 侧 的 变量 列表 中 选择 9 个 对 应 于 指标 体系 的 9 个 
变量 名 ,将 它们 置 人 右 侧 “variable(s)" 下 面 的 方 框 中 :选择 "地 区 "变量 ,将 其 添加 到 ”label 
Cases by” 下 面 的 小 方 框 中 ,选择 标记 变量 将 增强 距离 分 析 结 果 的 可 读 性 ;因为 要 做 Q 型 


聚 类 分 析 , 所 以 在 对 话 框 上 “cluster” 之 下 色 选 “Cases”( 在 对 变量 进行 R 型 从 类 分 析 时 ， pa 
则 要 勾 选 “Variables”) ;为 了 输出 需要 的 统计 量 和 图 形 ,“Display” 之 下 的 "Statistics" 与 ” 章 
“Plots” 都 要 处 于 被 勾 选 的 状态 。 如 图 8- ?7 所 示 。 类 
步骤 3: 计算 方法 的 设置 分 

单 击 主 对 话 框 上 的 “Method" 按 钮 ,可 以 打开 距离 计算 方法 设 园 的 对 话 框 , 即 *Hier- 
archical Cluster Analysis:” 对 话 框 ,如 图 8-8 所 示 。 3 
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图 8-8 设置 距离 计算 方法 的 对 话 框 
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本 例 中 ,虽然 有 些 变量 是 计数 变量 ,但 考虑 到 其 数值 分 布 范围 较 大 ,也 近似 地 以 等 距 
变量 看 待 , 个 案 间 距离 的 计算 方法 就 选择 欧 氏 距离 平方 (Squared Euclidean distance) 。 
在 该 对 话 框 的 “Cluster Method" 下 拉 菜 单 中 指定 的 是 小 类 之 间 的 距离 计算 方法 ,本 例 中 
选择 平均 连锁 法 (Between-groups Linkage)。 

在 个 案 间距 离 的 计算 上 ,如 果 指 标 体系 中 是 顺序 变量 ,等 级 变量 或 称 名 变量 , 则 需要 
将 其 作为 计数 变量 来 对 待 , 勾 选 *Counts” 后 在 其 对 应 的 下 拉 框 中 选择 算法 ,如 常 选 a 
算 ; 如 果 指 标 体系 中 是 二 项 记分 变量 , 则 需要 勾 选 “Binary" 后 在 其 对 应 的 下 拉 框 中 选择 算 
法 ,如 常 选 二 元 欧 氏 距离 平方 等 . 

另外 ,需要 特别 注意 的 是 ,本 例 中 的 各 个 变量 的 量 纲 不 一 致 ,需要 进行 量 纲 统一 , 然 
后 才能 进行 距离 的 计算 。 本 例 中 ,我 们 在 对 话 框 上 “Transform Values” 下 面 做 标准 化 转 
换 的 下 拉 框 中 选择 标准 分 的 转换 方法 , 即 *Z scores”, 因 为 Q 型 聚 类 分 析 是 针对 个 案 进 行 
的 ,所 以 在 标准 化 处 理 时 要 勾 选 <By cases”( 在 进行 R 型 聚 类 分 析 时 , 则 要 勾 选 “By varia- 
bles”) 。 

完成 上 述 设 置 后 , 单 击 "Continue" 返 回 主 对 话 框 。 

步骤 4: 指 定 图 形 的 输出 

单 击 图 8 -7 所 示 主 对 话 框 上 的 “Plots... ”按钮 ,打开 如 图 8-9 所 示 的 对 话 框 。 
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图 8-9 聚 类 分 析 的 图 形 输出 设置 对 话 栓 


一 一 ee@@ 和 @ 


SPSS 层次 聚 类 分 析 输 出 的 图 形 有 两 种 形式 : 树 形 图 (Dendrogram) 和 冰 桩 图 (Ici- 
cle) 。 树 形 图 展现 聚 类 分 析 的 每 一 次 合并 过 程 , 以 及 各 类 间 的 谱系 关系 ,是 聚 类 分 析 结 果 
中 最 为 直观 地 表现 聚 类 分 析 过 程 与 结果 的 图 形 。SPSS 系统 会 将 类 间距 离 转 换 为 “0 
25” 的 范围 , 即 最 大 距离 表示 成 25 个 单位 长 度 , 其 他 距离 按 比 例 标定 在 图 上 。 勾 选 图 
8 一 9 对 话 框 上 的 "Dendrogrom”" 即 可 输出 树 形 图 。 

冰 柱 图 通过 “X”" 符 号 显示 ,其 外 形 很 像 冬 天 房屋 下 的 冰 柱 , 故 得 其 名 。SPSS 默认 输 
出 聚 类 全 过 程 的 冰 柱 图 (ALL clusters)。 如 果 想 指定 显示 聚 类 中 某 一 阶段 的 冰 柱 图 , 则 
色 选 “Specified range of clusters”, 并 设置 从 第 几 类 开始 显示 (Start:), 到 第 几 类 结束 显示 
(Stop:) ,中 和 间 跨 度 几 类 (By:) 等 。 如 果 不 想 输出 冰 柱 图 , 则 可 以 勾 选 *None”。 

此 外 ,我 们 还 可 以 指定 冰 柱 图 显示 的 方向 ,在 “Orientation" 下 面 选 择 “Vertical” 表 示 
输出 纵向 冰 柱 图 .选择 “Horizontal" 表 示 和 输出 横向 冰 柱 图 ， 


m1 °° 





本 例 中 选中 *Dendrogrom” 选 项 ,并 选择 纵向 (Vertical) 输 出 聚 类 全 过 程 〈ALL clus 
ters) 的 冰 柱 图 。 如 图 8-9 所 了 示 。 单 击 “Continue" 按 钮 返回 主 对 话 框 。 

步骤 5: 凝聚 状态 表 输 出 设置 

单 击 图 8 -7 所 示 主 对 话 框 上 的 “Statistics:” 按 钮 ,打开 如 图 8- 10 所 示 的 对 话 框 。 
SPSS 默认 匀 选 “Agglomeratoin schedule”, 输 出 层次 聚 类 的 凝聚 状态 表 , 如 图 8-10 所 
示 。 单 击 “Continue” 按 钮 返回 主 对 话 框 。 
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图 8-10 凝聚 状态 表 及 个 案 归 关 输 出 设置 对 话 椎 

步骤 6: 设 定 保存 层次 聚 类 分 析 结 果 中 个 案 的 归属 关系 

单 击 图 8 -7 上 的 “Save" 按 钮 ,打开 如 图 8-11 所 示 的 对 话 框 。 

该 对 话 框 还 可 以 设置 输出 层 
次 聚 类 分 析 结 果 中 各 个 案 的 归属 ， 
即 显示 每 个 样本 属于 那个 类 ,并 将 
类 编号 后 保存 在 数据 文件 中 。 通 
过 对 话 框 上 *Cluster Merbership” 
的 选取 可 以 设 定 :(1)None: 不 显示 
类 成 员 构 成 ; (2)Single solution: 
选择 并 在 后 面 的 方 框 中 输入 一 个 
具体 的 数值 n(n 小 于 样本 总 数 ) 表 图 8-11 设置 取 类 结果 中 个 案 归 属 关系 的 对 话 枢 
示 显 示 笃 成 n 类 时 ,各 类 的 成 员 构 成 ;(3)Range of solutions: 选择 并 在 下 面 的 两 个 方 框 
中 输入 一 个 较 小 的 数 和 一 个 较 大 的 数 ( 不 超过 样本 容量 ) ,指定 显示 成 员 构 成 的 类 的 数目 
范围 。 单 击 "Continue" 返 回 主 对 话 框 .。 

完成 上 述 的 一 系列 设置 后 , 单 击 "OK"” 按 钮 ,SPSS 系统 即 完成 这 一 聚 类 分 析 的 过 程 ， 

除 距离 或 相似 性 系数 计算 方法 的 选择 有 些 差 异 外 ,R 型 聚 类 分 析 的 过 程 与 Q 型 聚 类 
分 析 基 本 一 致 ,所 以 不 再 对 R 型 聚 类 分 析 的 程序 作 专 门 介绍 。 


二 、 层 次 聚 类 分 析 结 果 的 输出 与 解释 


层次 聚 类 分 析 SPSS 过 程 的 主要 输出 结果 有 :凝聚 状态 表 , 能 够 系统 地 显示 聚 类 分 析 的 
每 一 阶段 所 完成 的 凝聚 任务 ; 树 形 图 和 冰 柱 图 ,能 够 直观 地 反映 聚 类 的 过 程 和 结果 ;如 果 要 
求 其 分 成 m 类 的 话 ,个 案 归 属 显示 表 , 可 以 清楚 地 显示 个 案 的 归属 情况 ,以 及 各 个 类 别 中 的 
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个 案 数 。 下 面 给 出 的 是 根据 本 节 中 例题 的 数据 进行 Q 型 聚 类 分 析 的 主要 结果 及 简单 说 明 。 


(一 ) 凝聚 状态 表 
所 输出 的 凝聚 状态 如 表 8- ?7 所 示 ( 有 所 简化 )。 该 表 主 要 显示 的 是 在 每 一 步 聚 合 中 ， 
是 哪 两 个 个 案 或 是 哪 两 个 小 类 凝聚 在 一 起 ,所 以 能 够 系统 地 反映 整个 聚 类 过 程 。 比 如 ， 
从 表 中 我 们 可 以 很 清楚 地 看 到 :第 一 次 聚合 ,是 2 号 样本 与 13 号 样本 聚合 成 一 个 小 类 
而 这 个 小 类 又 在 第 二 次 聚合 时 与 10 号 和 18 号 聚合 的 小 类 凝聚 在 一 起 构成 新 的 小 类 ,该 
新 的 小 类 包含 2 号 ,13 号 10 号 .18 号 样本 。 
表 8-7 | ee , 


Cluster Combined Cluster Combined 
Next Stage ee 
(二 ) 树 形 图 和 冰 柱 图 


层次 聚 类 分 析 输 出 的 树 形 图 如 图 8 - 12 所 示 。 
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图 8~12 层次 聚 类 分 析 输 出 的 树 形 图 


从 树 形 图 可 以 直观 地 看 出 样本 间 的 层次 关系 。 图 8-12 中 ,如 果 按 两 类 来 划分 的 话 ， 
就 会 根据 中 等 职业 教育 发 展 情况 ,将 北京 18 个 区 县 分 成 了 两 大 类 ,但 是 其 中 第 二 大 类 中 
只 有 一 个 样本 15( 平 谷 ) ,这 说 明 平 谷 在 中 等 职业 教育 发 展 方面 与 其 他 区 县 有 非常 明显 的 
不 同 ,结合 原始 数据 资料 可 以 看 到 ,该 样本 在 中 等 职业 教育 发 展 方面 还 存在 很 大 的 差距 
如 果 是 按照 三 类 来 划分 , 则 可 以 看 到 :平谷 一 个 区 县 作为 第 一 类 ,崇文 等 6 个 区 县 作为 第 
二 类 ,西城 等 11 个 区 县 作为 第 三 类 ， 

输出 的 冰 柱 图 也 能 够 直观 地 输出 聚 类 过 程 和 结果 ,此 处 不 再 列 出 。 


(三 ) 指明 分 成 几 类 后 的 样本 归属 表 
如 果 在 对 话 框 操作 过 程 中 ,指明 要 求 系统 输出 分 成 3 类 的 归属 表 , 则 系统 运行 就 会 
输出 如 表 8 - 8 所 示 的 样本 归属 表 。 


表 8-8 各 类 成 员 列 表 (Cluster Membership) 








ld of Case 3 Clusters ld of Case 3 Clusters 








Ww Fo fo 9 ff 9 6 SO ww 
be 一 


| 





三 、 快 速 聚 类 分 析 的 SPSS 过 程 


快速 聚 类 分 析 是 当 个 案 数 较 多 时 对 个 案 进 行 的 聚 类 。 我 们 依据 前 文 所 述 的 基本 过 
程 ,通过 实例 分 析 来 说 明快 速 聚 类 分 析 的 SPSS 过 程 。 

. 【 例 8-2]】〗 假如 要 对 一 些 高校 图 书馆 的 藏书 情况 进行 分 类 研究 ,统计 了 20 所 学 校 
的 图 书馆 的 藏书 ,包括 外 文 图 书 册 数 ( 万 册 ) 中文 图 书 册 数 ( 万 ) .过 刊 卷 数 (万 ). 现 刊 卷 
数 (万 ) .古籍 册 数 (万 ) .工具 书卷 数 (万 ) ,艺术 类 书籍 册 数 (万 ) ,数据 如 表 8-9 所 示 。 请 
根据 这 些 藏书 情况 ,将 图 书馆 分 为 三 类 。 

【 解 】 本 例 中 ,将 20 所 学 校 的 图 书馆 作为 样本 看 待 ,对 其 中 各 类 的 藏书 量 进行 统计 
共有 7 个 变量 。 采 用 快速 聚 类 分 析 , 其 SPSS 过 程 主 要 包括 以 下 步骤 : 

步骤 1: 数据 文件 的 建立 

建立 的 SPSS 数据 文件 由 20 行 8 列 组 成 ,其 中 20 行 对 应 于 20 所 图 书馆 的 个 案 ， 
有 7 列 对 应 于 表 中 的 7 项 调查 数据 ,另外 还 有 一 列 是 作为 个 案 标 识 变量 。 如 图 8-13 
所 示 。 

步骤 2: 打 开 主 对 话 框 并 完成 相应 的 设置 

单 击 *Analyze” 菜 单 选 择 “Classify" 中 的 “K-Means Cluster.. ”命令 ,如 图 8-13 所 
示 ,打开 层次 聚 类 分 析 的 主 对 话 框 , 如 图 8-14 所 示 。 
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表 8-9 20 所 高 校 图书 馆 的 藏书 情况 统计 
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图 8~13 快速 滩 类 分 析 的 数据 文件 与 操作 菜单 


Method 


® Merate and classify 三 Classify only 
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图 8~14 锯 速 聚 类 分 析 的 主 对 话 框 


在 如 图 8- 14 所 示 的 对 话 框 中 ,从 左 侧 的 变量 列表 中 选择 7 个 对 应 于 指标 体系 的 7 
个 变量 名 ,将 它们 置信 右 侧 “variable(s)”" 下 面 的 方 框 中 ;选择 "学校" 变量 ,将 其 添加 到 
“label Cases by” 下 面 的 小 方 框 中 ;因为 要 做 快速 聚 类 分 析 , 所 以 在 对 话 框 上 “Number of 
clusters” 之 后 填 人 要 分 类 的 数目 ,本 例 中 填 “3?”。 另 外 , 勾 选 “Iterate and classify”( 也 是 
SPSS 默认 状态 ) ,系统 在 进行 聚 类 过 程 中 ,可 以 根据 距离 计算 信息 ,自动 对 初始 中 心 点 坐 
标 进行 调整 ,可 作 多 次 迭代 以 获取 更 为 满意 的 结果 。 





步骤 3: 设置 输出 各 类 中 个 案 的 有 关 信息 人 
单 击 图 8 - 14 对 话 框 中 的 “Save” 按 钮 ,打开 “K-Means Cluster Analysis: Save New 
Variables" 对 话 框 ,如 图 8 - 15 所 示 。 该 对 话 框 可 以 指定 将 SPSS 快速 聚 类 分 析 的 结果 以 半 
变量 的 形式 保存 到 SPSS 的 数据 编辑 窗口 中 。 勾 选 图 8 - 15 中 的 两 个 项 目 , 可 以 分 别 将 多 
所 有 样本 所 属 类 别 号 、 距 所 属 类 中 心 点 的 欧 氏 距离 保存 到 数据 文件 中 。 . 
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图 8-15 设置 输出 各 类 个 案 信息 对 话 杠 
本 例 中 ,选择 这 两 项 后 单 击 "Continue" 按 钮 返回 主 对 话 框 ，。 
步骤 4: 设 置 输出 方差 分 析 表 和 相应 的 个 案 信 息 
单 击 主 对 话 框 上 的 “Options... ”按钮 ,打开 如 图 8- 16 所 示 的 对 话 框 。 该 对 话 框 可 
以 选择 输出 其 他 一 些 聚 类 分 析 的 结果 ,包括 对 聚 类 分 析 效 果 其 检验 作用 的 方差 分 析 表 ， 
还 可 以 设 定 对 缺失 数据 的 处 理 方式 。 勾 选 对 话 框 上 的 “Initial cluster centers”, 系 统 输出 
初始 的 类 中 心 点 坐标 ; 色 选 <ANOVA table”, 输 出 各 观测 变量 以 分 类 变量 为 自 变量 的 方 | 
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图 8-16 设置 聚 类 分 析 结 果 的 信息 及 方 葡 分 析 表 
差分 析 结 果 , 如 果 显 示 出 观测 变量 均 有 显著 性 差异 ,说 明 聚 类 分 析 的 结果 较为 有 效 ; 勾 选 
“Cluster information for each” ,系统 则 会 输出 样本 的 分 类 信息 和 它们 距离 所 属 类 中 心 点 
的 距离 。 某 个 案 如 果 离 其 所 在 类 的 中 心 点 越 近 , 则 说 明 该 个 案 越 能 反映 所 在 类 的 特征 。 
勾 选 三 项 设置 后 , 单 击 “Continue” 按 钮 返回 主 对 话 框 。 
完成 上 述 设置 后 单 击 主 对 话 框 上 的 “OK" 按 钮 ,SPSS 自动 完成 快速 聚 类 分 析 过 程 。 


四 、 快 速 聚 类 分 析 的 结果 及 其 解释 

结合 本 节 所 举 实例 ,来 说 明快 速 聚 类 分 析 的 主要 结果 . 

(一 ) 初始 的 类 中 心 点 坐标 

快速 聚 类 分 析 输 出 结果 中 的 第 一 部 分 ,主要 是 SPSS 系统 自动 指定 的 类 中 心 点 坐标 。 


由 于 需要 快速 聚 类 形成 3 类 ,因此 指定 了 三 个 初始 的 类 中 心 点 ,其 坐标 分 别 对 应 于 表 
8 一 10 中 的 1.2.3 列 。 


表 38-10 初始 的 类 中 心 点 (Initial Cluster Centers) 











Cluster 
上 人 
|、 
外 文书 籍 | 25. 80 41. 20 19. 20 
中 文书 籍 70. 40 38. 40 19. 20 
过 刊 23. 04 40. 96 15, 36 
现 H 51. 52 64. 96 40. 32 
古籍 书 30. 38 54. 12 31. 98 
工具 书 30, 63 54. 56 32. 24 
艺术 类 31. 12 55. 44 32. 76 





(二 ) 迭代 次 数 及 其 调整 距离 
本 例 中 , 聚 类 分 析 过 程 中 共 进 行 了 两 次 迭代 。 其 中 第 一 次 迭代 后 形成 的 新 类 的 中 心 
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点 坐标 与 初始 中 心 点 相 比 ,有 了 一 定 的 移动 ,比如 :第 一 次 迭代 后 第 一 类 的 中 心 点 离 初始 
的 第 一 类 中 心 点 之 间 的 距离 是 12. 328。 第 二 次 迭代 后 ,新 类 中 心 点 不 需要 再 调整 ,所 以 
本 例 中 的 分 析 过 程 只 有 两 次 迭代 ,如 表 8- 11 所 示 。 


表 8-11 快速 聚 类 分 析 中 的 选 代 过 程 (lteration History) 









Change in Cluster Centers 


Iterationm- 


10. 734 





.000 


(三 ) 各 类 所 属 的 个 案 信息 
输出 结果 给 出 了 各 类 中 的 个 案 信息 ,如 :每 一 类 中 包含 的 个 案 数 .包含 的 是 娜 些 个 
案 ,每 一 个 案 与 其 所 在 类 的 中 心 点 的 距离 是 多 少 等 。 


(四 ) 最 终 的 类 中 心 点 坐标 以 及 它们 之 间 的 距离 
表 8-12 所 示 的 结果 是 聚 类 分 析 的 最 终 类 中 心 点 坐标 ,反映 了 三 类 不 同学 校 图 书馆 
藏书 的 典型 特征 与 初始 的 中 心 点 坐标 相 比 ,发 生 了 一 些 变化 ,说 明 在 聚 类 分 析 过 程 中 ， 
它 自动 进行 了 调整 。 
表 8$-12 最 终 各 类 的 类 中 心 点 [Final Cluster Centers) 


Cluster 





另外 ,系统 还 输出 了 三 个 类 中 心 点 之 间 的 距离 。1 类 与 2 类 .2 类 与 3 类 ,1 类 与 3 类 
中 心 点 间距 分 别 为 46. 026、42. 704、33. 686 。 


(五 ) 方差 分 析 表 
系统 以 新 的 分 类 变量 为 自 变量 ,对 各 观测 变量 进行 单 因素 方差 分 析 并 输出 方差 分 析 
表 。 本 例 中 方差 分 析 的 结果 如 表 8- 13 所 示 。 
由 表 8-13 所 示 的 表格 看 出 ,本 例 中 三 类 图 书 七 个 不 同类 的 藏书 方面 均 存 
在 很 显著 的 差异 ,说 明 它 们 分 成 三 类 具有 一 定 的 合理 性 和 可 靠 
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表 8-13 快速 聚 类 分 析 的 方差 分 析 表 











观测 变量 Cluster Error 要 
MS df MS df 
外 文书 籍 288. 000 2 34. 034 17 8. 462 .003 
中 文书 籍 1811.172 2 105.445 i 19. 78 .000 
过 刊 389.967 2 46. 084 17 8. 462 .003 
现 刊 1068.108 2 51.078 17 20,911 .000 
古籍 书 690.212 2 12. 441 17 55,478 .000 
证 其: 二 12. 644 17 55,479 * .000 
术 术 用 7234.231 2 13.053 17 55.482 .000 
和 一 复习 思考 与 练习 题 二 
1. 解 词 
聚 类 分 析 .相似 性 系数 .距离 


2, 聚 类 分 析 的 功能 是 什么 ? 
, 如 何 进行 测量 指标 的 量 纲 调整 ? 
. 聚 类 分 析 的 种 类 有 哪些 ? 
. 层次 聚 类 分 析 与 快速 聚 类 分 析 的 一 般 过 程 各 是 怎样 的 ? 
. 消费 结构 是 指 人 们 在 生活 中 消费 的 物质 资料 和 接受 服务 种 类 及 其 比例 关系 。 表 8- 
14 中 数据 涉及 变量 包括 :总 消费 支出 .食品 消费 支出 .衣着 消费 支出 ,家庭 设 备用 品 消 费 支 
出 、 医 疗 保健 消费 支出 ,交通 消费 支出 .和 通信 消费 支出 .教育 文化 消费 支出 .居住 消费 支出 、 
杂项 消费 支出 。 借 助 于 SPSS 系统 ,就 表 中 数据 分 别 对 个 案 .变量 进行 层次 聚 类 分 析 。 

表 8-14 2005 年 不 同 地 区 居民 消费 结构 数据 了 


地 区 总 消费 食品 衣着 家具 医保 交通 教育 居住 其 他 


河南 5294 1855 650 332 436 569 694 578 176 
山西 5654 ”1917 747 314 401 587 901 641 169 
黑龙 江 5567 1972 719 215 537 548 762 611 201 
内 蒙古 6219 2024 897 360 473 699 858 627 277 

青海 5758 2056 621 438 451 566 746 664 212 

新 对 5773 2083 766 292 375 615 840 566 233 

河北 -5819 2142 630 343 550 595 682 705 168 

宁夏 5821 2156 636 364 440 646 651 660 265 

吉林 ”6068 2180 739 254 527 643 795 700 229 
甘肃 5937 2204 736 336 411 601 853 572 221 

陕西 6233 2236 609 409 513 583 1025 646 209 

贵州 5494 2260 585 286 301 601 793 468 198 

江西 5337 2296 513 328 268 498 785 505 141 

山东 6673 2310 829 457 484 801 983 601 206 | 


OD A 内 
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了 ”中 华人 民 共 和 国 国 家 统计 局 以 中 国 统计 年 鉴 一 2005》}, 中 国 统计 出 版 社 ,2005 年 版 。 
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第 九 章 “线性 回归 分 析 
Ga 


变量 间 存 在 相关 关系 时 ,也 就 具备 了 建立 预测 关系 的 基础 。 在 相关 变量 间 建 立 预 测 方 
程式 的 统计 学 方法 叫 回 归 分 析 , 包 括 线性 和 非 线性 ,一 元 和 多 元 的 回归 分 析 。 本 章 介 绍 较 
为 简单 的 一 元 线性 回归 分 析 和 多 元 线性 回归 分 析 。 一 元 线性 回归 分 析 就 是 在 两 个 具有 线 
性 相关 关系 的 变量 间 建 立 预 测 方 程式 ,实现 用 一 个 变量 预测 和 控制 另 一 个 变量 的 目的 ;多 
元 线性 回归 分 析 就 是 建立 用 一 组 变量 预测 和 控制 某 一 个 变量 的 回归 方程 式 。 具 体 包括 : 回 
归 方 程 模型 假设 ,回归 方程 参 教 的 计算 、 回 归 方 程 对 观测 数据 的 拟 合 度 、 方 程 有 效 性 检验 、 方 
程 的 应 用 以 及 回归 分 析 在 SPSS 系统 中 实现 的 过 程 。 


回归 分 析 (analysis of regression) 是 通过 建立 相关 变量 间 的 数学 模型 ,来 实现 对 随机 现 - 


象 间 不 确定 性 关系 的 数量 化 描写 ,从 而 实现 对 随机 变量 的 估计 、 预 测 和 控制 之 目的 ,是 相关 
分 析 的 应 用 、 延 伸 和 推广 。 本 章 主要 介绍 线性 回归 方程 的 建立 ,检验 、 应 用 及 其 SPSS 过 程 。 


第 一 节 ”回归 分 析 概 述 


一 AR AS rp 
一 、 回 归 分 析 的 意义 A 


“回归 ”一 词 是 英国 统计 学 家 高 尔 顿 (F. Galton) 在 研究 了 很 多 父母 身高 与 其 成 年 子 
代 身高 关系 后 提出 来 的 。 用 父母 亲身 高 的 平均 值 作为 横 坐 标 ,用 对 应 的 成 年 孩子 的 身高 
作为 纵 坐标 ,高 尔 顿 根据 从 数 千 户 家 庭 获 取 的 数据 制作 成 散 点 图 ,发 现 这 些 散 点 有 汇聚 
成 一 条 直线 的 趋势 ,用 这 条 直线 能 够 概括 性 地 描述 父母 身高 和 子 代 身 高 的 关系 ,并 可 用 
于 对 子 代 身 高 的 预测 。 具 体 地 说 ,高 尔 顿 发 现 :高 个 子 父 母 的 孩子 可 能 会 比较 高 , 矮 个 子 
父母 的 孩子 可 能 会 比较 矮 。 但 有 趣 的 是 :父母 身高 极端 高 或 极端 矮 时 ,其 子女 的 身高 未 
必 也 会 极端 高 或 极端 矮 ,而 是 会 向 中 间 水 平 收 伍 。 高 尔 顿 将 这 种 现象 称 为 “回归 ”, 将 那 
条 贯穿 于 散 点 中 的 可 能 直线 称 为 "回归线 "。 后 来 ,人 们 借用 * 回 归 ?这 个 词 ,将 研究 随机 
现象 间 数 量变 化 关系 的 方法 叫做 回归 分 析 。 

客观 世界 中 事物 之 间 的 相互 关系 ,往往 可 以 表征 为 各 种 变量 关系 ,从 数 的 角度 看 ,这 
此 变量 关系 可 以 概括 为 两 种 ;函数 关系 和 相关 关系 。 函 数 关系 是 一 种 确定 性 的 关系 ,是 
指 对 于 某 一 个 或 多 个 变量 的 一 组 确定 的 值 , 另 一 个 变量 就 有 一 个 确定 的 值 与 之 对 应 。 比 
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如 ,在 银行 有 一 定 的 存款 , 当 存 入 额 、 存 人 周期 .银行 存款 利率 等 变量 有 了 确定 的 值 后 ,就 
会 有 一 个 确定 的 利息 值 与 之 对 应 ,这 种 变量 的 关系 就 是 具有 确定 性 的 。 相 关 关 系 则 是 具 
有 不 确定 性 的 关系 ,是 指 对 于 一 个 或 多 个 变量 的 一 组 确定 的 值 , 对 应 的 另 一 个 变 基 却 是 
一 个 随机 变量 , 它 会 在 一 定 范围 内 随机 变动 ,要 想 获 得 对 这 些 随机 变动 的 规律 性 的 认识 ， 
往往 需要 进行 较 大 量 的 观测 和 收集 较 多 的 数据 ,发 现 统计 规律 。 

前 文 已 经 介绍 过 ,统计 学 中 可 以 通过 相关 关系 分 析 这 些 具有 不 确定 性 的 变量 关系 ， 
即 ;分析 变量 之 间 是 否 存在 相关 ?是 正 相关 还 是 负 相 关 ? 相 关 程 度 是 高 还 是 低 ? 相关 分 析 
中 ,我 们 将 所 有 变量 置 于 相同 地 位 ,是 寻求 对 等 关系 ,不 是 寻求 谁 决定 谁 或 谁 预测 谁 的 关 
系 。 但 是 ,现实 生活 或 各 种 管理 工作 中 ,人 们 经 常 在 做 着 预测 的 事情 。 比 如 :根据 学 生 的 
数学 成 绩 预测 他 是 否 可 能 在 将 来 的 理工 领域 取得 成 就 ;根据 学 生 的 智商 水 平 预测 他 是 否 
可 能 取得 较 好 的 学 业 成 绩 ; 根 据 气 流 运动 和 温度 空间 分 布 等 预测 未 来 一 段 时 间 是 否 有 降 
雨 ; 根 据 多 项 经 济 指标 预测 股市 行情 等 等 。 这 种 预测 关系 的 建立 显然 是 建立 起 了 一 种 非 
对 等 的 关系 ,其 中 变量 的 地 位 是 不 平等 的 。 而 要 建立 这 种 具有 预测 功能 的 关系 ,一 般 的 相 
关 分 析 是 不 能 胜任 的 ,需要 采用 回归 分 析 的 方法 。 

回归 分 析 中 变量 之 间 的 地 位 是 不 对 等 的 ,分 为 自 变量 和 因 变 量 。 回 归 分 析 就 是 建立 
自 变 量 与 因 变 量 之 间 的 关系 模型 ,这 个 模型 也 叫 回归 方程 。 利 用 回归 方程 ,可 以 用 一 个 
或 多 个 自 变量 的 值 去 预测 一 个 因 变 量 的 值 。 自 变量 与 因 变 量 的 地 位 互 换 , 其 回归 关系 的 
意义 也 就 发 生 了 改变 ,计算 的 结果 也 会 不 同 。 根 据 回归 关系 ,只 能 用 自 变 其 的 值 预测 因 
变量 的 值 ,而 不 能 用 因 变 量 值 去 估计 自 变量 的 值 。 而且, 建立 回归 方程 的 目的 多 半 是 为 
了 用 较 容易 测量 的 变量 去 预测 较 难 测量 的 变量 ;用 可 以 获得 现存 资料 的 变量 去 预测 事物 
未 来 的 发 展 变化 。 

根据 回归 分 析 是 用 一 个 变量 去 预测 另 一 个 变量 ,还 是 用 一 组 变量 去 预测 另 一 个 变 
量 , 可 将 其 划分 为 一 元 回归 分 析 和 多 元 回归 分 析 ; 根 据 预 测 变 量 与 被 预测 变量 之 间 是 线 
性 相关 关系 ,还 是 非 线 性 相关 关系 ,可 以 将 其 划分 为 线性 回归 分 析 和 非 线性 回归 分 析 ， 
本 章 介绍 的 是 线性 回归 分 析 。 


二 、 回 归 分 析 的 基本 逻辑 


既然 回归 分 析 的 基本 任务 是 建立 变量 间 的 数学 模型 , 即 建立 因 变 其 与 白 变 量 的 函数 
关系 。 那 么 ,这 里 首先 要 有 一 个 假设 , 即 因 变 量 与 一 个 或 一 些 自 变 量 之 间 具 有 某 种 数量 
关系 ,用 方程 表示 就 是 : 
yy 一 (zivzwwyzi) 十 月 (公式 9-1) 
方程 中 的 y 是 被 预测 的 变量 , 叫 因 变量 ;zi .zz、…\ 习 是 用 来 预测 y 的 变量 , 叫 自 变 
量 。 这 一 方程 所 表达 的 含义 是 :因为 y 与 这 一 组 自 变 量 ri zz、zte 具有 相关 关系 ,所 
以 自 变 量 的 变化 会 引起 y 的 伴随 变化 。 从 某 种 意义 上 说 ,可 以 根据 这 一 组 自 变 基 的 值 去 
计算 或 预测 因 变 量 的 值 。 可 是 ,相关 关系 是 不 确定 性 关系 , 当 自 变量 的 值 确定 后 ,y 的 值 
不 是 一 个 确定 的 值 ,而 是 可 能 偏离 依靠 y= f(z ,zs，… ,ze) 这 一 函数 关系 计算 得 出 的 值 ， 
即 可 能 会 产生 一 个 预测 偏差 。 所 以 在 这 一 函数 关系 式 中 需要 加 上 一 个 校正 值 8, 这 个 校 
正 值 实际 的 意义 就 是 :用 一 组 自 变 量 的 值 去 预测 一 个 y 值 时 产生 的 预测 偏差 , 即 误差 。 
由 于 预测 偏差 是 其 他 一 些 不 确定 性 的 随机 因素 引起 的 ,所 以 8 实际 上 是 一 个 随机 误差 。 





每 一 次 用 确定 的 一 组 自 变 量 值 去 预测 y 值 产生 的 误差 也 不 确定 ,如 果 进 行 很 多 次 地 预 

测 ,就 会 得 到 很 多 个 不 同 的 误差 量 , 这 些 误差 是 正 态 分 布 的 ,其 平均 值 为 0, 预测 的 因 变 量 

也 因为 随机 误差 的 影响 而 呈现 正 态 分 布 。 用 y 来 表示 预测 值 的 平均 值 , 则 有 : 
y=frirr er Ti) te (公式 9 一 2) 


2 _ Df ns rt) te] 


N = f(x" ,Ts) 《公式 9-3) 


在 y i 

因 变 量 的 平均 值 。 或 者 ,如 果 我 们 能 够 通过 一 系列 观测 资料 ,评估 预测 误差 的 分 布 情况 ， 

就 可 以 预测 因 变量 的 取 值 范围 ， 总 而 言 之 ,要 想 建立 因 变量 与 自 变量 之 间 的 预测 关系 ， 

就 是 要 建立 它们 之 间 确 定 的 函数 关系 ,并 尽 可 能 地 评估 预测 误差 的 大 小 ,这 就 是 回归 分 

析 的 核心 任务 。 换 句 话说 ， 并 旺 分 板 租 术 必 在 关 蒜 最 肝 立 居 扫 方 和 并 证 作 式 和 下 个 
具体 地 说 ,回归 分 析 的 一 般 过 程 是 : 

步骤 1: 提 出 假设 的 回归 模型 

研究 者 首先 应 通过 调查 与 分 析 , 确 定 要 预测 的 因 变 量 ,以 及 可 能 对 这 个 因 变 量 产生 
影响 或 与 该 因 变 量具 有 相关 关系 的 变量 的 种 类 及 个 数 ; 然 后 再 根据 研究 目的 ,选择 其 中 
影响 大 .相关 度 可 能 较 高 的 变量 作为 自 变量 。 如 前 文 所 述 , 自 变量 是 现实 中 容易 测量 的 ， 
因 变量 则 是 现实 中 较 难 测量 或 是 未 来 可 能 的 发 展 结果 。 变 量 选 定 后 ,建立 预测 关系 的 方 
向 或 目标 就 确定 了 。 

步骤 2: 在 实验 或 调查 中 获取 数据 资料 

通过 实验 或 大 量 的 实际 观测 及 调查 ,取得 较为 可 靠 的 数据 资料 。 这 项 工作 是 研究 者 
进行 回归 分 析 的 前 提 和 基础 ,其 数据 质量 也 决定 回归 分 析 工 作 的 质量 。 若 获取 的 数据 资 
料 不 可 靠 , 后 续 的 工作 就 没有 实际 意义 了 。 

步骤 3: 估计 回归 方程 的 函数 形式 

利用 所 获取 的 大 量 数据 资料 , 先 用 直观 的 方式 如 绘制 散 点 图 分 析 变 量 关 系 的 形态 ; 
再 根据 函数 拟 合 方式 ,确定 应 通过 哪 种 数学 模型 来 概括 回归 线 。 车 自 变量 和 因 变 量 之 间 
存在 线性 关系 , 则 应 进行 线性 回归 分 析 ; 若 自 变量 与 因 变量 存在 非 线 性 关系 , 则 应 进行 非 
线性 回归 分 析 。 

步 巡 4: 回 归 方 程 的 参数 估计 

确定 回归 方程 的 数学 模型 后 ,主要 的 工作 就 是 根据 所 收集 的 数据 资料 来 确定 方程 中 
的 一 些 参 数 。 因 为 有 了 确定 的 参数 ,预测 关系 就 建立 起 来 了 。 那 么 按照 什么 逻辑 来 确定 
这 些 参数 ? 即 如 何 得 到 确定 的 回归 方程 ? 

在 建立 回归 方程 之 前 ,我 们 得 到 了 大 量 的 样本 资料 ,这 些 资料 应 该 是 每 一 个 因 变 量 
值 都 有 与 之 对 应 的 一 个 或 一 组 自 变量 值 。 因 此 可 以 设想 :要 是 能 建立 起 一 个 回归 方程 ， 
就 可 以 将 一 组 确定 的 自 变量 值 代 入 其 中 得 到 因 变 量 的 一 个 预测 值 :将 该 预测 值 与 对 应 的 
因 变 量 观 测 值 作 比较 ,就 能 得 到 一 个 预测 误差 值 s ;将 从 很 多 个 案 中 观测 得 到 的 数据 代 
人 ,就 得 到 一 系列 的 预测 误差 值 。 

很 明显 ,我 们 期 望 得 到 这 样 的 回归 方程 :一 是 要 能 保证 预测 误差 总 和 等 于 0 或 接近 
于 0, 二 是 按照 方程 顶 测 的 因 变 量 能 最 接近 于 真实 的 观测 值 , 即 预测 误差 的 绝对 值 或 者 说 
预测 误差 的 平方 和 要 尽 可 能 小 。 根 据 观 测 的 数据 和 假设 模型 ,我 们 实际 上 可 以 建立 起 一 
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系列 的 关于 因 变 量 与 自 变 量 的 预测 关系 式 , 其 中 有 一 个 是 最 优 的 , 即 用 它 来 估计 因 变 量 
所 带 来 的 误差 平方 和 最 小 ,该 预测 关系 式 就 叫做 回归 方程 。 因 为 满足 这 一 条 件 就 意味 着 
回归 方程 能 够 与 观测 数据 有 "最 佳 拟 合 "。 所 以 ,回归 方程 最 佳 拟 合 原 则 就 是 误差 平方 和 
达到 最 小 , 即 Q 达到 最 小 : 
Q= Ye (公式 9-4) 

这 里 的 Q 表示 误差 平方 和 ,在 回归 分 析 中 也 称 为 剩余 平方 和 。 回 归 分 析 最 核心 的 任 
务 就 是 依据 观测 的 实际 数据 ,按照 Q=>) e? 最 小 原则 确定 函数 中 的 参数 ,这 种 方法 也 叫 
做 最 小 二 乘法 。 

步骤 5: 回 归 方 程 的 有 效 性 检验 

根据 样本 数据 建立 起 回归 方程 后 ,应 对 其 进行 各 种 检验 ,看 其 是 否 真 实地 反映 了 因 
变量 与 自 变量 之 间 的 数量 关系 。 回 归 方程 的 有 效 性 检验 主要 包括 :回归 方程 的 显著 性 检 
验 .回归 方程 的 拟 合 优 度 检验 .回归 系数 的 显著 性 检验 。 

回归 方程 有 效 性 检验 的 主要 目的 是 考察 回归 方程 预测 的 因 变 量 值 与 实际 观测 的 因 
变量 值 之 间 相 关 程 度 的 高 低 。 相 关 越 高 ,说 明 预 测 值 与 实际 观测 值 越 具 有 一 致 性 ,回归 
方程 越 能 有 效 地 反映 自 变量 与 因 变 量 之 间 的 变化 关系 。 


三 、 回 归 方 程 的 应 用 


建立 变量 间 有 效 的 回归 方程 ,能 够 揭示 变量 间 真 实 的 或 可 能 的 数量 关系 ,从 某 些 侧 
面 描 述 客观 事物 运动 的 规律 性 。 有 了 规律 性 的 认 误 ,就 可 以 实现 某 些 预 测 和 控制 。 估 
计 、 预 淹 因 变量 的 主 值 (类 似 于 点 估计 ) 或 取 值 范围 (类 似 于 区 间 估 计 ), 是 回归 分 析 的 主 
要 目的 所 在 。 回 归 方 程 所 揭示 的 关系 能 够 帮助 我 们 ,通过 控制 或 调整 自 变量 的 值 而 达到 
控制 因 变 量变 化 趋势 的 目的 。 .当然 ,利用 回归 方程 进行 控制 ,多 见于 自然 科学 研究 领域 。 
心理 科学 领域 中 ,更 多 的 是 利用 回归 方程 进行 估计 和 预测 。 


第 二 节 ”一 元 线性 回归 分 析 


一 、 一 元 线性 回归 模型 


一 元 线性 回归 是 最 简单 的 回归 模型 , 它 所 揭示 的 是 一 个 自 变 量 与 一 个 因 变 量 之 间 的 
线性 关系 ,因此 回归 模型 可 以 大 致 表示 成 如 下 形式 : 
Y=at+pX+e (公式 9-5) 
这 一 方程 中 的 X 是 自 变 量 ,Y 是 因 变 量 ,a 和 有 是 待 求 参数 ,es 表示 随机 误差 。 很 
明显 ,按照 这 一 模型 , 自 变量 与 因 变 量 之 间 的 一 元 线性 回归 方程 就 是 了 = 二 a 十 BX。 该 回 
归 方 程 建立 的 过 程 实际 上 就 是 根据 一 些 样本 数据 计算 回归 方程 中 的 两 个 参数 a 和 8 的 
过 程 。 
前 文 已 经 指出 ,回归 方程 是 研究 具有 一 定 不 确定 性 的 变量 的 关系 。 当 自 变 量 X 取 某 
一 个 确定 的 数值 X, 时, 因 变量 Y 不 是 一 个 确定 的 值 ,而 是 一 个 随机 变化 的 ,明正 态 分 布 


的 二 组 值 , 这 一 组 值 的 平均 值 就 叫做 X=Xv 时 Y 的 真 值 , 可 以 将 上 述 关系 表示 成 图 9 1 
所 示 的 形式 。 
如 图 9-1 所 示 , 以 X 和 YY 分别 为 横 坐 标 和 纵 坐 标 所 做 的 散 点 不 是 在 一 条 直线 上 ,但 
是 这 些 散 点 的 分 布 有 着 明显 的 直线 趋势 。 在 依据 大 样本 数据 作出 的 变 基 间 关 系 的 散 点 
图 中 ,如 果 可 以 找到 一 条 特定 的 直线 ,使 得 各 观测 点 与 该 直线 的 总 变异 量 最 小 , 则 这 条 直 
线 就 叫做 自 变 量 与 因 变 量 之 间 关系 的 回归 线 , 用 数学 形式 表示 就 是 : 
了 一 4 十 5X (公式 9-6) 





9-1 一 元 线性 回归 方程 示意 图 


在 这 个 方程 中 , 立 叫做 对 应 于 X 的 工 变量 的 估计 值 或 真 值 ;参数 a 表示 该 直线 在 y 
轴 的 截 距 ,参数 5b 表示 该 直线 的 斜率 ,叫做 Y 对 X 的 回归 系数 (coefficient of regression) 。 
这 个 方程 被 称 为 Y 对 的 一 元 线性 回归 方程 (linear equation) ,反映 了 XX 与 Y 的 线性 
关系 。 


二 、 一 元 线性 回归 方程 的 参数 计算 


要 建 立 一 元 线性 回归 方程 ,就 要 先 计算 方程 中 的 参数 a 和 5b。 根据 最 佳 拟 合 原则 , 回 
归 线 是 指 散 点 图 中 每 一 个 点 沿 Y 轴 方 向 到 该 直线 的 距离 的 平方 和 最 小 的 那 条 直线 , 即 要 
使 误差 平方 和 最 小 。 
因为 :Q= 6e= 了 CY 一 ?一 > (Y 一 a 一 bX) 所 以 要 求 Q 最 小 , 则 可 将 问题 
转化 为 求 Q 对 a 5 的 一 阶 偏 导数 ,并 令 其 等 于 零 组 成 偏 导 方程 组 ,然后 解 方程 组 求 出 参 
数 估计 值 。 即 : 
总 -一 2 了 (Y—a—bX)—0,90——2 3) (XY—aX—bX’)=0 


整理 可 得 到 :; DY Y=nat+bX, D) XY=a 2) X+bX? 
解 方 程 组 得 到 : 

a=Y—bX {公式 9-7) 
> A, da $Y es 


b= 三 = 
3(X 一 7 


(公式 9-8) 
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PT TY 


为 方便 计算 ,参数 5b 经 整理 还 可 表示 为 : 
yxy— a XY 


TY fp 《公式 9-9) 


a 


简 而 言 之 ,一 元 线性 回归 方程 建立 的 方法 是 :通过 对 样本 的 观测 ,得 到 变量 X 和 Y 的 
一 批 对 应 的 观测 值 ;然后 根据 公式 9-7 计算 出 参数 ,根据 公式 9-8 或 公式 9-9 计算 出 
参数 5; 最 后 得 到 一 元 线性 回归 方程 Y= 二 a 十 bX。 
【 例 9。- 1] 某 中 学 为 预测 学 生 的 高 考 数学 成 绩 ,意欲 建立 高 考 数学 成 绩 Y 对 平时 成 绩 
X 的 线性 回归 方程 。 现 随机 抽取 10 名 考生 的 数据 列 于 表 9 - 1, 求 该 一 元 线性 回归 方程 。 
【 解 】 首先 根据 表 9- 1 中 给 出 的 观测 值 X 和 Y 的 值 ,计算 每 个 数据 的 中 间 值 X*、 
3 
根据 表 中 计算 的 结果 ,将 数据 代 人 公式 (9-7) 和 (9-9) 可 得 : 
YXY 一 XY 62739— 
b= 0.723 
Fx: — CD 60549— Tn 


表 9-1 10 ed 


学 生 编 号 | 平时 考试 均 分 (X) | 高 考 数学 成 绩 (Y) 





775 805 60549 65143 62739 





a=Y—bX=80.5—0.723X77.5=24. 468 
于 是 得 到 一 元 线性 回归 方程 :Y 二 24. 468 十 0. 723X。 


三 、 一 元 线性 回归 方程 的 有 效 性 检验 


(一 ) 回归 方程 的 显著 性 检验 : 

根据 一 个 样本 的 观察 数据 求 出 一 个 回归 方程 后 ,需要 对 该 方程 进行 有 效 性 检验 , 进 
而 确认 它 的 应 用 价值 。 由 一 元 线性 回归 模型 可 知 , 因 变 量 Y 各 观察 值 之 间 的 差异 (或 与 
其 均值 的 差异 ) 主要 来 自 两 方面 原因 :一 是 自 变 量 X 的 取 值 不 同 ;二 是 其 他 随机 因素 带 来 
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的 随机 误差 s。 

因此 可 以 将 因 变 量 Y 的 总 变异 量 SS+ 分 解 成 两 部 分 :其 中 一 部 分 是 根据 回归 方程 可 
以 预测 到 的 由 自 变量 X 所 带 来 的 变异 量 即 回归 平方 和 SSrx; 另 一 部 分 是 由 随机 误差 带 来 
的 剩余 平方 和 SSe, 如 图 9-2 所 示 。 





9-2 回归 分 析 中 因 变 量变 异 量 分 解 


于 是 就 有 : 
SSr=SSk+SSE (公式 9 一 10) 
DY = 》) (将 一 7) 十 DY—?) (公式 9-11) 
很 明显 ,在 回归 分 析 中 可 以 应 用 方差 分 析 方 法 对 回归 方程 进行 有 效 性 检验 。 正 如 图 
9-2 所 显示 的 那样 :在 因 变量 Y 的 总 变异 量 中 ,随机 误差 所 带 来 的 变异 量 越 大 ,意味 着 图 
中 散 点 离开 回归 线 越 远 , 回 归 变 异 量 也 就 越 小 ;否则 反之 。 由 此 可 见 , 回 归 变 异 量 所 占 总 
变异 量 的 比例 能 够 反映 和 散 点 汇聚 回归 线 的 程度 。 相 应 地 ,回归 方差 越 大 ,误差 方差 就 越 
小 ,回归 方差 与 误差 方差 的 比率 下 一 让 一 AS 就 越 大 。 如 果 下 达到 了 显著 性 水 平 ,表示 
Y 与 XX 全体 的 线性 关系 显著 ,线性 回归 方程 是 有 效 的 ,利用 线性 回归 模型 反映 YY 与 X 的 
关系 是 恰当 的 ;反之 ,如 果 下 值 未 达到 显著 性 水 平 , 则 表示 Y 与 X 全 体 的 线性 关系 不 显 
著 , 线 性 回归 方程 无 效 , 利 用 线性 回归 模型 反映 与 X 的 关系 是 不 恰当 的 。 
回归 方程 有 效 性 检验 的 虚无 假设 是 所 求 回归 方程 无 效 , 假 设 的 实质 是 由 自 变量 决定 
的 回归 方差 并 不 显著 大 于 剩余 方差 。 所 以 ,采用 下 检验 : 
_MSs 2 Co 
MSs SY—?:/n—2 
其 中 :分 子 自由 度 为 dfs 一 1 分 母 自由 度 为 dfs 一 n 一 2。 
一 元 线性 回归 方程 有 效 性 检验 的 方差 分 析 表 如 表 9 -2 所 示 。 
表 9-2 一 元 线性 回归 方程 方差 分 析 胡 





F 





(公式 9 一 12) 





变异 源 平方 和 自由 度 均 方 F | 
回归 方程 。 SS 1 MS。= SSs/1 六 
随机 误差 SSr m 一 2 AMSE 一 SSe/(n 一 2) 


合 计 SSr n—l 


器 斗 并 


LT Ea 


DL A 于 问世 号 艺 呆 怀 了 党 腊 襄 


在 显著 性 水 平 a 确定 的 条 件 下 ,根据 回归 自由 度 和 剩余 自由 度 , 查 下 值 分 布 表 ,可 得 
检验 临界 值 。 如 果 计 算得 到 的 下 值 小 于 临界 值 , 则 接受 虚无 假设 ,认为 回归 方程 无 效 ;如 
果 计 算得 到 的 下 值 大 于 临界 值 , 则 拒绝 虚无 假设 ,认为 回归 方程 有 效 。 

为 了 计算 的 方便 ,回归 方程 的 方差 分 析 也 可 以 使 用 下 列 公式 计算 变异 量 : 


2 
SSr= >》 (Y—Y:= SY:— ‘2 (公式 9-13) 





SS = RD -=8| 5 xX:— CD | (公式 9- 14) 
n 


(二 ) 回归 方程 的 拟 合 优 度 

回归 方程 的 方差 分 析 可 以 告诉 我 们 :回归 方程 是 否 有 效 的 ? 自 变量 X 和 因 变量 Y 之 
间 是 否 存在 显著 性 的 线性 关系 ? 如 果 检 验 的 结果 显示 回归 方程 未 达到 显著 性 水 平 , 则 说 
明 方程 无 效 , 不 能 有 效 地 反映 X 与 了 的 线性 关系 ,或 者 说 ,X 和 YY 不 存在 明显 的 线性 关 
系 ; 如 果 回 归 方 程 达到 了 显著 性 水 平 ,说 明 回 归 方程 有 效 , 回 归 线 能 够 与 实际 观测 的 数据 
很 好 的 拟 合 ,能 够 有 效 反映 X 和 YY 的 线性 关系 ,或 者 说 ,X 和 Y 存在 明显 的 线性 关系 。 
方差 分 析 虽 然 可 以 告诉 我 们 某 一 回归 方程 是 否 有 效 ,但 却 不 能 告诉 我 们 回归 方程 的 有 效 
性 大 小 。 所 以 我 们 还 需要 一 个 能 够 判定 回归 方程 有 效 性 大 小 的 系数 ,叫做 判定 系数 或 决 
定 系 数 , 也 叫做 回归 方程 的 拟 合 优 度 。 

刚才 已 经 分 析 过 ,回归 变异 量 SSn 所 占 因 变 量 总 变异 量 SSy 的 比例 越 大 ,XX 和 YY 的 
线性 关系 越 明 显 , 回 归 方差 在 反映 这 种 关系 方面 越 是 有 效 。 于 是 ,统计 学 就 将 回归 变异 


SS。 2 (了 一 7): 





为 有 :i Re R: = 9 
量 与 因 变 量 总 变异 基 的 比率 定义 为 判定 系数 , 记 为 Ser” STy yy 
归 方 程 代入 并 经 过 推导 变换 可 得 到 : 

Re SS -7 (Xt 
SSr DY—Y): nSxSy 
= 了 二。 YI ZxZv 一 二 (公式 9- 16) 


即 一 元 线性 回归 方程 有 效 性 的 判定 系数 R* 正好 等 于 自 变 量 X 与 因 变 量 Y 的 积 差 
相关 系数 ~ 的 平方 。 

【 例 9-2】 试 对 例 9 - 1 中 建立 的 一 元 线性 回归 方程 进行 显著 性 检验 ,并 计算 其 判 
定 系数 R*。 

【 解 】 先 建立 虚无 假设 和 研究 假设 : 

FH :所 建立 的 一 元 线性 回归 方程 无 效 ; Hi :所 建立 的 一 一 元 线性 回归 方程 有 效 。 

将 表 9- 1 中 数据 和 回归 方程 的 参数 5 代入 公式 9-13 和 公式 9-14 可 得 : 


SSr= TY:— -A CI 一 65143 一 5205 一 340.5 
p rm 于 :x -7 
=B| 5 x:— (0. 723)* X < (oosts "1 )=253. 961 


SS 一 5S97 一 SS 一 86， 539 
而 分 子 自由 度 dfr 三 1 ,分母 自由 度 df 一 n 一 2 二 8。 


MS: 86.539/8 

若 显著 性 水 平 e 一 0. 01, 查 得 分 子 自由 度 为 1、 分 母 自由 度 为 8 的 下 临界 值 为 11. 26， 
所 求 下 值 远 远大 于 临界 值 ,拒绝 虚无 假设 ,认为 该 一 元 线性 回归 方程 显著 。 而 其 判定 系 
数 为 : 

R-[ 之 C 一 加 。 (YC—Y) 
nSxSy 

可 见 ,在 一 元 线性 回归 方程 有 效 性 检验 中 ,其 判定 系数 R* 正 是 因 变 量 与 自 变量 的 相 
关系 数 的 平方 。 就 本 例 来 说 ,学 生平 时 数学 考试 成 绩 的 平均 值 可 以 有 效 预 测 其 高 考 数学 
考试 成 绩 ,预测 的 有 效 性 达到 74. 6%，。 


四 、 一 元 线性 回归 方程 的 应 用 


回归 方程 的 实践 意义 在 于 利用 方程 估计 或 预测 因 变 量 。 利 用 回归 方程 进行 的 预测 
或 估计 包括 点 估计 和 区 间 估 计 两 种 。 点 估计 就 是 将 确定 的 自 变量 值 X, 直接 代入 回归 方 
程 , 计 算得 到 相应 的 回归 值 Y 。 例 如 就 例 9-1 来 说 , 若 某 学 生平 时 数学 考试 成 绩 平均 为 
85 分 , 则 可 以 对 其 高 考 数 学 成 绩 进行 的 点 估计 为 :Y; 二 24. 468 十 0. 723X 一 24. 468 十 
0.723X85 一 85.923。 

区 间 估 计 是 以 一 定 的 概率 为 保证 ,预测 当 自 变量 为 某 一 确定 值 时 因 变 量 的 置信 
区 间 。 

对 于 给 定 的 自 变量 X, ,可 以 有 以 下 两 种 不 同 的 预测 :一 是 与 X, 对 应 的 因 变量 取 值 
均值 的 预测 ,二 是 与 X; 对 应 的 单个 因 变量 值 的 预测 。 就 例 9 - 1 中 对 数学 平时 平均 成 
绩 为 85 分 时 其 高 考分 数 的 预测 ,可 以 是 预测 所 有 数学 平时 成 绩 为 85 分 的 学 生 数 学 高 
考 成 绩 的 均值 可 能 的 区 间 , 也 可 以 是 预测 某 个 数学 平时 成 绩 为 85 分 的 学 生 的 数学 高 
考 成 绩 可 能 的 区 间 。 作 为 点 估计 两 种 预测 都 是 一 样 的 ,但 作为 区 间 估 计 前 者 的 范围 将 


小 一 些 


2 
| = 二 0. 746 


(一 ) 对 因 变 量 均 值 的 区 间 居 计 
可 以 证 明 , 因 变量 均值 (或 真 值 ) 区 间 估 计时 的 标准 误 为 : 


Su 一 S | 十 一 (公式 9-17) 
n OO,(X—X) 


若 给 定 的 置信 系数 为 1 一 a, 则 对 于 确定 的 自 变 量 值 X;, 其 因 变 量 均值 的 预测 区 
间 为 : 
{Yi—tys * Sy ;tt * Sp) (公式 9 一 18) 
式 中 ,是 自由 度 为 n 一 2, 夹 中 间 概 率 面积 为 1 一 a 的 上 分 布 双 侧 分 位 数值 。Y; 是 与 
自 变 量 某 确定 值 X, 对 应 的 点 估计 值 。 
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(二 ) 对 单个 因 变 量 的 预测 
对 单个 样本 的 因 变 量 值 作 区 间 估 计 的 标准 误 为 : 


Sr 十 二 十 和 生 二 全 (公式 9- 19) 





单个 因 变 量 的 预测 区 间 为 : 
{ 他 一 上 ia。SF ,ts * Se } (公式 9-20) 
从 公式 9-17 和 公式 9-19 的 比较 中 可 以 看 出 ,Sy 比 Sy 多 加 了 一 个 Syx ,因此 与 因 
变量 均值 预测 区 间 相 比 , 单 个 因 变 量 的 预测 区 间 宽 度 有 所 增加 。 即 利用 回归 方程 对 单个 
因 变 量 进行 预测 的 置信 区 间 大 于 对 因 变 量 均值 进行 预测 的 置信 区 间 。 
【 例 9-3】 利用 例 9- 1 的 数据 和 例 9- 1 中 所 建立 的 回归 方程 ,预测 数学 平时 成 绩 
为 85 分 的 学 生 的 高 考 数 学 成 绩 的 均值 置信 区 间 和 单个 学 生 的 高 考 数 学 成 绩 的 置信 区 


间 , 饥 信和 度 控制 在 95%。 


【 解 】 当 义 ==85 时 , 因 变 量 点 估计 值 为 :Y; 二 24. 468 十 0. 723X 二 85. 923 


回归 估计 的 标准 误 为 :Syx = VY 2)(Y 一 卫 )*/n 一 2 = 3.289 ,所 以 : 
因 变 量 均 值 估计 的 标准 误 为 : 


(X— x (85 二 77.5 _ 
Ss=Sm | 二 本 + 17 


单个 因 变 量 值 估计 的 标准 误 为 : 
(X— Ry: TT 
5% 1 二 二 "tx 289XA/ 1 十 10 十 80549 二 60062 5 
=3, 626 


自由 度 为 "一 1 一 8, 查 : 值 琢 得 :ti* 一 2.306, 于 是 利用 公式 9-18 可 以 计算 得 到 置 
信和 度 为 0. 95 的 因 变 量 均值 的 置信 区 间 为 4{82. 401,89. 445}, 即 凡是 平时 数学 成 绩 为 85 
分 的 那些 学 生 ,他们 高 考 数 学 成 绩 的 平均 分 有 95% 的 可 能 是 处 在 区 间 {82. 401,89. 445) 
之 内 的 。 

利用 公式 9- 20 可 以 计算 得 到 置信 度 为 0. 95 的 单个 因 变 量 的 估计 区 间 为 177. 561， 
94.285), 即 平时 数学 成 绩 为 85 分 的 学 生 其 高 考 数学 成 绩 有 95% 的 可 能 是 处 在 区 间 
{177. 561,94. 285} 之 内 的 。 

通过 分 析 公 式 (9- 17) 和 (9 - 19) ,我 们 可 以 知道 预测 区 间 的 宽窄 受到 下 述 因 素 的 
影响 : 

第 一 , 自 变 量 的 确定 值 X; 离 平 均值 X 越 近 , 预 测 区间 越 窄 , 因 变量 估计 越 精确 。 

第 二 , 自 变量 的 变异 量 >， (X 一 X): 越 大 ,预测 区 间 越 窜 , 反 之 越 宽 。 在 n 恒定 时 ， 
>》)(X 一 外 )? 反映 自 变量 的 离散 程度 。 说 明 获 取 观 测 资料 时 ,取样 范围 越 大 ,预测 区 间 
越 窗 , 因 变 量 估计 越 精确 。 


第 三 ,样本 容量 越 大 ;预测 区 间 越 窜 : 因 变 基 估计 越 精确 。 
第 四 ,回归 估计 标准 误 Svx 越 小 ;预测 区 间 越 窗 ; 因 变量 估计 越 精确 。 


第 三 节 ”多 元 线性 回归 分 析 


一 、 多 元 线性 回归 模型 


在 教育 与 心理 学 研究 领域 ,一 个 因 变 量 往往 同时 受到 多 个 自 变 量 的 影响 。 如 学 生 的 学 
习 成 绩 会 受到 学 生 的 智商 .学习 态度 ,学习 方法 .教学 水 平 ,学习 环境 等 多 个 因素 的 影响 ,这 
时 我 们 若 要 更 加 有 效 , 精 确 地 预测 因 变量 就 必须 引 人 多 个 自 变 基 ,建立 多 元 回归 模型 。 
多 元 线性 回归 模型 是 指 含 有 两 个 或 两 个 以 上 自 变量 的 线性 回归 模型 ,用 于 揭示 因 变 
量 与 多 个 自 变 量 之 间 的 线性 关系 。 其 数学 模型 是 : 
Y=pB+B Xi 二 +B Xt 二 BX;+e (公式 9-21) 
式 中 参数 B ,中 ,…,8 称 为 回归 系数 ,B 称 为 回归 常数 ,e 是 随机 误差 ,Y 为 服从 正 态 
分 布 的 随机 变量 。 因 此 ,多 元 线性 回归 方程 表达 式 为 : 
了 = 十 XX 十 bo Xz 十 … 十 bX， (公式 9 -22) 
回归 系数 5 表示 :在 其 他 自 变量 不 变 的 情况 下 , 自 变量 XX; 变动 一 个 单位 时 ,引起 的 
因 变 量 Y 的 变动 量 。 多 元 线性 回归 分 析 的 内 容 与 一 元 线性 回归 分 析 基 本 相似 ,只 是 计算 
过 程 复杂 得 多 ,一 般 都 借用 统计 软件 来 完成 。 


二 、 多 元 线性 回归 方程 的 参数 计算 


多 元 线性 回归 方程 中 ,回归 系数 的 计算 同样 遵循 Q= >) e 最 小 的 最 佳 拟 合 原则 ， 
采用 最 小 二 乘法 进行 。 其 中 Q= SSe= >) e= 2) (Y 一 人 ): 

根据 微 积 分 中 求 极 小 值 的 原理 ,和 欲 使 Q 达到 最 小 , 须 将 Q 分 别 对 5,、5;、…,b; 求 偏 导 
数 并 今 其 等 于 零 ; 加 以 整理 后 可 得 到 (i 十 1) 个 方程 式 组 成 的 方程 组 ; 解 方程 组 便 可 得 到 回 
归 方 程 中 的 各 个 参数 值 。 在 此 ,以 二 元 线性 回归 方程 的 建立 为 例 ,介绍 多 元 线性 回归 方 
程 中 的 参数 计算 方法 。 

二 元 线性 回归 方程 可 表示 为 : 立 一 包 十 证 X 十 入 X 。 使 用 最 小 二 乘法 可 得 到 方程 组 : 


YY 一 ni 十 加 > Xth OK: (公式 9- 23) 
3 XiY=bo 3 克 十 及 六 X 十 2 OA (公式 9-24) 
S KAY=h 3) Xith, > XK Kath 2 XE (公式 9-25) 


解 上 述 方程 组 便 可 得 到 参数 b, . 凡 ,b; 值 ,建立 起 二 元 线性 回归 方程 。 

上 述 计 算 过 程 虽然 烦 杂 一 些 , 但 是 基本 原理 是 与 一 元 线性 回归 方程 参数 计算 完全 一 

样 的 。 在 实际 应 用 中 ,一般 都 将 烦 杂 的 计算 交 由 计算 机 去 完成 。 如 果 不 借用 计算 机 ,也 
可 以 使 用 下 列 较 为 简便 的 一 些 公 式 进 行 参 数 计 算 : 

bo=Y—b, Ki—b: 到 。 (公式 9 一 26) 

LivLsz—LavLs 


4 Ly Ls 一 了 


QR 9 -27) 


sg 全 委 站 小 语 回 凡 洲 山 汁 对 





和 本 万 王 机 00 上 林业 于 莹 了 


LayLui—LirLa 


b, 
La 一 了 ia 


(公式 9- 28) 
其 中 : 

Lu= D(Xi—R) = SK — (SRI) 

La = > (2 — Ke) = SNE— (DN) /n 

l= y= DR = RN = 


= DX Re) — (PX SX)/n 
Ly = >)(X — ROY—Y) = DX DO X,. DY)/n 
Ly = >)(X: — RY)Y—Y) = >)(X DDD KX, Dn 
【 例 9-4】 某 公 司 对 15 名 员工 进行 考评 , 测 得 他 们 的 文化 基础 知识 尺 , 和 专业 技能 
Xz: 两 项 成 绩 如 表 9- 3 所 示 , 同 时 将 用 人 部 门 对 他 们 的 实际 工作 能 力 的 评定 结果 同 列表 
中 (满分 都 是 10 分 )。 请 建立 员工 实际 工作 能 力 对 两 项 测评 成 绩 的 线性 回归 方程 。 
【 解 】 计算 公式 中 包含 的 一 些 中间 值 ,将 结果 记录 在 表 9- 3 中 ,然后 将 相应 数据 代 
人 公式 9-23、 公 式 9-24 和 公式 9-25, 即 可 得 到 如 下 的 可 解 方程 组 ， 
105 一 15b 十 87 和 十 99b, 
637 一 87 如 十 5650 十 60420。 
724 一 99 加 十 6040) 十 689b; 
解 方程 组 即 可 得 到 线性 回归 方程 中 的 参数 值 :b= 二 1.237、b, 二 0.058、b, 一 0.822, 所 
以 本 例 中 得 到 的 二 元 线性 回归 方程 是 :了 ==1. 237 十 0. 058X 十 0. 822X。。 
表 9-3 员工 能 力 回归 分 析 的 数据 表 
















2 
me 


XiXs XY XY 









1 3 5 6 
2 1 6 
3 5 了 了 25 49 49 35 39 49 
1 7 8 9 49 64 81 56 63 72 
5 6 9 条 36 81 49 54 42 63 
6 8 罗 9 64 49 81 56 ?2 63 
了 了 6 了 49 36 49 42 49 42 
8 9 8 8 81 64 64 72 72 64 
9 5 8 9 25 64 81 40 45 72 
10 9 了 了 81 49 49 63 63 49 
11 2 3 4 4 9 16 6 8 12 
12 了 5 5 16 25 25 20 20 25 
13 5 25 49 49 35 35 19 
6 5 4 
8 有 





87 99 105 565 


三 、 多 元 线性 回归 方程 的 有 效 性 检验 


多 元 回归 方程 建立 后 同样 需要 进行 有 效 性 检验 ,以 判断 它 是 否 具 有 实用 价值 。 过 元 
线性 回归 方程 有 效 性 检验 基本 原理 同一 元 线性 回归 方程 相似 ,也 采用 方差 分 析 方 法 ， 
多 元 线性 回归 方程 有 效 性 检验 的 虚无 假设 Hs; 各 回归 系数 同时 与 零 元 显著 莽 弄 。 
即 是 说 ;全 体 自 变量 取 值 无 论 如 何 变 化 都 不 会 引起 自 变量 Y 的 线性 变化 ,所 有 的 自 变量 
都 无 法 解释 Y 的 线性 变化 ,Y 与 所 有 自 变量 不 存在 线性 美 系 , 所 建立 的 名 元 线性 回归 方 
程 是 无 就 的 。 
检验 统计 其 是 下 ,其 计算 公式 为 ; 
Fo=MSr_ SF — Tk 
MS > — 
式 中 为 自 变量 个 数 ,m 为 样本 数 。 方 差分 析 结 果 可 写成 表 9 -4 的 形式 。 
表 9-4 备 元 线性 回归 方程 方差 分 析 囊 





(公式 9 一 29) 





蛮 异 源 平方 和 自由 诬 后 方 EF p 
回归 方程 。 SS k MSN 一 有 SS 人 MSIEST 
随机 误 甘 SS 一 一] MSE 二 SSE/ (N11 

各 条 ee 9 一 J 





[ 例 9-5] 试 对 例 9-4 中 建立 的 二 元 线性 回归 方程 进行 显著 性 检验 。 
[ 解 】 采用 下 检验 ,检验 统计 量 的 计算 如 下 中间 计 算 环 节省 瞳 }: 
,MSg _ 13. 556 
MSE 1.074 
在 下 分 布 表 中 , 当 a 一 0.01 ,分 子 自由 度 为 2, 分 母 自由 度 为 12 时 ,F 临 界 全 为 6.93， 
远 远 小 于 该 方程 的 下 统计 值 ,所 以 该 二 元 线性 回归 方程 是 有 效 的 , 因 变 量 Y 与 目 变 量 的 
线性 美 系 是 显著 的 ,方程 具有 预测 效用 
多 元 线性 回归 方程 同样 需要 进行 拟人 台 优 度 检 验 , 以 判断 其 有 效 性 程度 。 尽 与 一 元 线 
性 回归 方程 的 判定 系数 意义 相同 ,等 于 回归 平方 和 占 因 变量 总 平方 和 的 比例 ,也 等 于 因 
变量 与 自 变量 相 英 系数 的 平方 。 不 过 ,在 名 元 线性 回归 方程 中 , 自 变量 不 止 一 个 ,所 以 
vv 了 RE 反映 的 是 国 变量 Y 与 上 个 自 变 量 之 问 的 相关 程度 ,因此 又 称 为 了 与 上 个 自 变 量 的 复 
相关 系数 ， 
在 多 元 线性 回归 方程 有 效 性 检验 中 ,需要 综合 考 虚 因 变 量 与 多 个 自 变量 的 相关 ,十 
要 对 判定 系数 进行 调整 。 调 整 后 的 判定 系数 , 记 为 RR ,其 表达 式 为 ; 
Rl (公式 9 一 30) 
所 的 取 值 范围 与 R: 样 ,也 是 在 0 一 1 之 间 , 它 越 接 近 于 1, 回归 方程 与 实际 观测 值 的 
拟 全 讼 越 高 ,方程 有 效 性 程度 就 越 高 ;反之 .RR 越 接 近 于 0, 拟 合 度 越 低 ,方程 有 效 性 程度 
也 越 低 。 由 公式 9-30 可 知 , 调 整 后 的 判定 系数 尺 考虑 的 是 平均 的 误差 平方 和 ,而 不 是 
湿 差 平方 和 。 在 多 元 线性 回归 分 析 中 , 必 可 以 剿 除 自 变量 个 数 对 拟 合 优 度 的 影响 ,所 以 
比 R: 更 能 准确 地 反映 回归 方程 对 样本 数据 的 拟 合 程度 。 也 就 是 说 :作为 回归 方程 的 有 








= 12, 623 


一 一 志 重量 太夫 闻 中 硬 回 储 洲 二 过 中 





[ELLLS | 


$9 HW DnT 悚 闻 莹 网 





效 性 高 低 程度 的 评估 指标 ,天 更 可 靠 。 因 此 在 多 元 线性 回归 分 析 中 ,我 们 通常 用 大 统计 
其 代替 一 元 回归 分 析 中 的 R* 统计 量 。 

在 例 9-4 中 所 建立 的 二 元 回归 方程 中 ,其 拟 合 优 度 检 验 统计 量 展 一 0. 624; 而 R? = 
0. 678。 因 为 R* 可 能 会 高 估 方 程 的 拟 合 度 ,所 以 采用 R* 更 客观 准确 。 


、 回 归 系 数 的 显著 性 检验 


在 一 元 线性 回归 分 析 中 ,因为 只 有 一 个 自 变量 ,所 以 整个 方程 的 有 效 性 检验 和 回归 
系数 的 显著 性 检验 是 完全 等 价 的 :方程 有 效 就 是 因为 自 变量 与 因 变 量 有 显著 性 的 相关 。 
在 多 元 线性 回归 分 析 中 ,方程 有 效 只 能 在 总 体 上 说 明 因 变量 与 自 变 量 存在 相关 。 或 者 
说 :至 少 有 一 个 自 变量 与 因 变 量 有 显著 性 的 线性 相关 ,但 并 不 说 明 所 有 的 自 变 基 均 与 因 
变量 存在 线性 相关 。 所 以 需要 逐一 检验 每 一 个 自 变 量 与 因 变 量 之 间 是 否 存在 显著 的 线 
性 相关 ,也 就 是 要 对 每 个 回归 系数 进行 显著 性 检验 ， 

如 果 检 验 发 现 , 某 回归 系 数 达 到 了 显著 性 水 平 , 说 明 对 应 的 自 变量 与 因 变 量具 有 
显著 的 线性 相关 , 它 可 以 在 预测 因 变 量 的 变化 上 发 挥 有 效 作用 ,就 可 以 保留 在 回归 方 
程 中 ;如 果 某 回归 系数 未 达到 显著 性 水 平 ,说 明 对 应 的 自 变量 与 因 变 量 间 没有 显著 的 
线性 相关 , 它 在 预测 因 变 基 的 变化 上 不 会 发 挥 太 大 作用 ,可 以 将 其 剔除 以 使 回归 方程 
简化 。 

多 元 线性 回归 方程 回归 系数 的 显著 性 检验 的 虚无 假设 有 H, :8 二 0, 即 第 i 个 自 变 量 对 

应 的 回归 系数 与 零 无 显著 性 差异 ， 其 检验 一 般 都 用 上 分布 ,统计 量 为 : 
t=B/Sa (公式 9-31) 
式 中 :1; 统计 量 服从 自由 度 为 dr 一 "一 上 一 1 的 +t 分布.Ss 为 回归 系数 8 的 标准 误 : 
SA SC (公式 9-32) 

查 + 表 得 到 a 显著 性 水 平 下 的 临界 值 。 zx-t-n。 着 4; 的 绝对 值 大 于 临界 值 , 则 拒绝 
虚无 假设 而 认为 该 回归 系数 达到 了 显著 性 水 平 , 相 应 的 自 变 基 与 因 变量 之 问 存 在 显著 的 
线性 关系 ,应 保留 在 方程 中 ;车 4, 的 绝对 值 小 于 临界 值 , 则 接受 虚无 假设 而 认为 该 回归 系 
数 未 达到 显著 性 水 平 ,相应 的 自 变 量 与 因 变 量 之 间 没 有 显著 的 线性 关系 ,可 将 其 从 方程 
中 剔除 。 

经 计算 得 到 : 例 9-4 所 建立 的 回归 方程 中 , 自 变 量 X, 的 回归 系数 所 的 4 二 0. 332; 
自 变 量 X; 的 回归 系数 bs 的 1 二 3. 628 查 t 值 表 得 临界 值 t0.o51202, 三 2 179, 所 以 自 变量 
Xi 对 因 变 量 的 线性 影响 并 不 显著 ,可 日 除 ;而 自 变量 X* 对 因 变 量 的 线性 影响 显著 ,应 保 
留 在 回归 方程 里 。 


五 、 自 变量 的 筛选 


在 求 得 多 元 线性 回归 方程 后 , 需 对 自 变量 进行 筛选 ,把 其 中 对 因 变 量 作用 不 显著 的 
自 变 量 剔除 以 达到 简化 方程 的 目的 ,减少 计算 量 和 降低 计算 误差 。 
通过 统计 方法 筛选 自 变量 一 般 有 :向 后 剔除 法 .向 前 选择 法 、 逐 步 回归 法 三 种 基本 


(一 ) 向 后 剔除 法 

向 后 剔除 法 (Backward) 是 自 变 量 不 断 被 剔除 出 方程 的 过 程 。 首 先 , 所 有 自 变量 全 部 
进入 回归 方程 ,并 对 回归 方程 中 所 有 的 回归 系数 进行 显著 性 检验 ;然后 ,在 回归 系数 未 达 
到 显著 性 水 平 的 一 个 或 多 个 自 变量 中 ,剔除 检验 统计 量 + 值 最 小 的 变量 ,也 就 是 将 其 中 对 
国 恋 量 作用 最 小 的 那个 变量 先 剔除 ,并 重新 建立 回归 方程 和 进行 检验 。 如 果 新 建 的 回归 
方程 中 所 有 变 基 的 回归 系数 检验 都 显著 ; 则 回归 方程 建立 结束; 否则 按照 上 述 方法 继续 
剔除 不 显著 的 变量 ,直到 所 有 变量 作用 都 显著 为 止 。 


(二 ) 向 前 选择 法 

向 前 选择 法 (Forward) 是 自 变量 不 断 进 人 回归 方程 的 过 程 ， 首先 ,选择 与 因 变 量具 
有 最 高 线性 相关 系数 的 变量 进入 方程 ,并 对 回归 方程 进行 各 种 检验 ;然后 ,在 剩余 的 变量 
中 选择 与 因 蛮 量 往 相 关系 数 最 高 并 通过 显著 性 检验 的 变量 进入 回归 方程 ,并 进行 各 种 检 
验 ; 一 直 重 复 这 个 过 程 直到 没有 可 进 人 方程 的 变 莉 为 止 。 


(三 ) 逐步 回归 法 

峻 步 回 归 法 (Stepwise) 是 向 后 剔除 法 和 向 前 选择 法 的 结合 , 它 在 向 前 选择 的 每 一 步 
都 考虑 先前 进 人 的 变量 是 否 需 要 剔除 。 因 为 随 着 变量 不 断 地 进 人 ,由 于 自 变量 之 间 存 在 
-. 定 程度 的 多 重 共 线 性 ,使 得 某 些 已 经 进入 回归 方程 的 自 变量 的 回归 系数 可 能 不 显著 ， 
逐步 回归 法 是 按 每 个 自 变量 对 因 变 量 的 作用 ,从 大 到 小 逐个 地 引信 方程 每 引入 一 个 自 
变量 ,都 要 对 回归 方程 中 的 每 个 自 变 量 进行 一 次 显著 性 检验 ,并 根据 向 后 蓟 除法 ,将 方程 
中 ! 值 最 小 且 符 人 台 事 先 设 定 的 剔除 判 据 的 变量 日 出 方程 ;重复 进行 直到 方程 内 的 自 变 量 
均 符 合 进入 方程 的 判 据 ,方程 外 的 自 变量 均 不 符合 进入 方程 的 判 据 为 止 , 最 终 形成 的 回 
归 方 程 就 是 最 优 的 方程 . 

多 元 线性 回归 方程 中 自 变 量 的 选择 ,以 及 利用 凶 元 线性 回归 方程 对 因 变 量 值 进行 点 估 
计 和 区 间 佑 计 , 在 计算 上 都 十 分 复杂 ,一 般 要 借助 计算 机 才能 完成 , 故 在 此 不 再 详细 介绍 。 


第 四 节 回归 分 析 的 SPSS 过 程 


回归 分 析 的 计算 量 一 般 比 较 大 ,所 以 往往 需要 借助 计算 机 统计 分 析 软 件 来 完成 。 这 
里 和 分别 介绍 一 元 线性 回归 分 析 和 多元 线性 回归 分 析 的 SPSS 过 程 。 

一 、 一 元 线性 回归 分 析 的 SPSS 过 程 

利用 SPSS 系统 对 例 9 一 1 中 的 数据 进行 一 元 线性 回归 分 析 , 步 骤 如 下 

步骤 1: 建立 数据 文件 

一 元 线性 回归 分 析 涉及 一 个 自 变量 .一 个 因 变 量 , 其 数据 文件 至 少 包 括 这 两 列 变量 
的 数据 。 例 9- 1 中 的 数据 包括 10 名 学 生平 时 数学 考试 的 平均 成 绩 和 高 考 数学 成 绩 ' 权 
建立 的 是 以 平时 成 绩 预 测 高 考 成 绩 的 回归 方程 ,所 以 将 平时 成 绩 记 为 自 变量 X; 高 考 成 
绩 记 为 因 变 量 立 ,如 图 8-3 所 未 。 
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全 步骤 2: 对 话 框 设置 和 操作 


单 击 莱 单 "Analyze" 选 择 "Regression” 中 的 "Linear,,, "命令 ,打开 对 话 框 如 图 9-4 所 
示 ; 将 对 话 框 左边 变量 列表 中 的 因 变量 Y 置信“Dependent" 下 面 的 方 框 中 ,而 把 自 变量 X 
置信 “Independents" 下 面 的 方 框 中 ;在 Method 框 中 ,默认 选择 *Enter" 选 项 ,表示 所 选 自 
变量 全 部 进入 回归 模型 。 
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转生 = 车 元 定性 回归 冰 析 对 话 杠 


步骤 3: 回 归 方 程 有 效 性 检验 的 设置 
| 单 击 主 对 话 框 上 的 "Statisties.., "按钮 + 打开 "Linear Regression :Statistica” 对话 框 ， 


pa 


如 图 9-5 所 示 , 色 选 对 话 框 上 的 “Model fit” 和 *Estimates” 两 个 选项 (一 般 也 是 默认 选 
项 ,所 以 这 一 步 操作 其 实 是 可 以 省 略 的 ) ,此 一 设置 可 以 输出 判定 系数 .调整 的 判定 系数 、 
回归 方程 的 标准 误 上 检验 的 方差 分 析 表 等 ; 单 击 "Continue” 按 钮 返回 主 对 话 框 ;然后 再 
单 击 "OK" 按 钮 即 可 输出 结果 。 





图 9-5 一 元 线性 回归 方程 有 效 性 检验 对 话 框 


步骤 4: 主要 输出 结果 的 读 取 与 解释 














系统 输出 的 结果 主要 包括 三 个 部 分 : 
01) 方程 的 拟 合 优 度 。 如 表 9 -5 所 示 ,一 元 线性 回归 方程 拟 合 优 度 检 验 的 判定 系数 
R? 二 0.746, 说 明 自 变量 X 能够 有 效 地 预测 Y 的 变化 , 即 学 生平 时 的 数学 考试 成 绩 能 比 性 
较 有 效 地 预测 其 高 考 的 数 党 成绩， ~ 
表 9-5 模型 总 结 {Model Summary) 
Model R R Square Adjusted R Square Std. Error of the Estimate 3 
= ] .864 .746 ,了 14 3, 28897 ; 1 
(2) 回归 分 析 的 方差 分 析 。 如 表 9-6 所 示 , 由 回归 方程 有 效 性 的 方差 分 析 表 可 知 : 
回归 方程 达到 了 很 显著 性 的 水 平 (F 一 23.477,p=0.001 一 0.01) ,说明 自 变量 与 因 变 量 直 
接 具 有 很 显著 的 线性 相关 ， 
表 9-6 回归 方程 有 效 性 检验 的 方差 分 析 表 (ANOVA) 
Sum of Squares df Mean Square F Sig. 
i 253. 961 1 253. 961 23.477 .001 
Residual 86. 539 8 10. 817 | 
Total 340. 500 9 


To 
(3) 回归 系数 及 其 显著 性 。 表 9 - 7 显示 ,本 例 中 的 回归 常数 4a 二 24. 506, 回 归 系数 | 

4b 二 0.723。 回 归 系 数 的 显著 性 检验 结果 是 :二 4. 845, 显 著 性 水 平 p= 二 0.001 二 0. 01, 达 到 

了 很 显著 性 的 水 平 。 | 


得 到 的 一 元 线性 回归 方程 为 :Y= 二 24. 506 十 0. 723X。 
i 


e089 Hn nT 由 于 北周 三 








表 9-7 归 系 数 及 其 显著 性 检验 (Coefficients) 


Unstandardized 





Standardized 








Sig, 
Coefficients Coefficients 电 
Model B Std. Error Beta 
] (Constant) 24, 506 11. 603 B112 .0868 
X ey .149 . 864 4.845 .00] 





a Dependent Variable; Y 


二 、 多 元 线性 回归 分 析 的 SPSS 过 程 


多 元 线性 回归 分 析 的 SPSS 过 程 与 一 元 线性 回归 分 析 基 本 一 致 ,只 是 变量 选择 方法 


有 所 不 同 。 


【 例 9-6】 某 公司 对 15 名 员工 进行 考评 , 测 得 他 们 的 文化 基础 知识 得 分 X .专业 
技能 得 分 X* 及 智商 Xi 如 表 9-8 所 示 , 并 且 又 将 用 人 部 门 对 他 们 的 实际 工作 能 力 评定 
得 分 Y 列 于 表 中 。 试 通过 回归 分 析 , 研 究 员工 的 文化 基础 知识 .专业 技能 和 智商 对 其 实 


际 工作 能 力 的 影响 。 


表 9-8 员工 实际 工作 能 力 影响 因素 的 回归 分 析 数 据 囊 





步骤 1: 建 立 数据 文件 
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多 元 线性 回归 分 析 的 SPSS 过 程 主要 包括 如 下 步 又。 
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图 9~6 多 元 线性 回归 分 析 的 数据 文件 及 革 单 示意 图 
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员工 编号 1 2 3 4 - 司 | BW Ry TR A 
Xi 3 4 5 7 5 8 ?7 9 5 9 2 ! ) 6 7 
X: 5 6 8 温 博 光滑 了 间 ? 3 5 和 
Xs 98 102 114 106 118 126 120 108 97 103 94 99 116 100 115 
Y 6 了 于 济 了 J he 7 5 了 1 9 





多 元 线性 回归 分 析 涉 及 多 个 自 变量 、 一 个 因 变量 ,其 数据 文件 至 少 包括 多 列 自 变量 
和 一 列 因 变 量 的 数据 。 例 9 -6 中 的 数据 包括 15 名 员工 的 四 项 数据 资料 ,X, 为 文化 基础 


知识 分 、X; 为 专业 技能 分 、X; 为 智商 分 \Y 工作 能 力 分 等 。 要 建立 的 是 Xi 一 X3 为 自 变 
最 、Y 为 因 变 量 的 多 元 线性 回归 方程 ,相应 的 数据 文件 如 图 9 -6 所 未 。 

步骤 2; 对话 框 设置 和 操作 

单 击 菜 单 “Analyze” 选 择 "“Regression" 中 的 "Linear,.. "命令 ,打开 对 话 框 如 图 9-7 所 
示 。 将 对 话 框 左边 变量 列表 中 的 因 变 量 Y 置 人 “Dependent" 下 面 的 方 框 中 ,而 把 自 变量 
X, 一 X; 置 入 *Independents" 下 面 的 方 框 中 。 在 Method 框 中 ,选择 “Backward" 选 项 (还 
步 剔 除法 )。 
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图 9-7 多 元 线性 回归 分 析 主 对 话 框 及 其 操作 示意 图 


步骤 3: 回 归 方 程 有 效 性 检验 的 设置 

此 一 步骤 的 操作 与 一 元 线性 回归 分 析 相 同 。 单 击 主 对 话 框 上 的 ”Statistics.… “按钮 ， 
打开 *Linear Regression: Statistics"” 对 话 框 , 如 图 9-5 所 示 。 勾 选 对 话 框 上 的 “Model 
fit* 和 “Estimates” 两 个 选项 。 单 击 "Continue" 按 钮 返回 主 对 话 框 ,然后 再 单 击 *OK" 按 钮 
即 可 输出 结果 。 

步骤 4: 主 要 输出 结果 的 读 取 与 解释 

系统 输出 的 结果 主要 包括 四 个 部 分 : 

(1) 分 步 剔 除 自 变量 获得 一 系列 回归 方程 。 如 表 9-9 所 示 , 回 归 分 析 输 出 的 第 一 个 
结果 是 三 个 线性 回归 模型 或 方程 ,其 中 : 


表 9-9 进入 或 移出 的 自 变量 (Variables Entered/ Removed) 


LT El 








Model Variables Entered Variables Removed Method 
1 XI3. Xl1, AX2 Enter 
2 ” X1 Backward 
3 


5 X3 Backward 
由 
S00. 207 


LL 





方程 一 :了 二 a 十 bX 十 bs Xs 十 bsX，， 三 个 自 变 晤 均 进 入 方程 ,变量 选择 方法 是 
“Enter”; 

方程 二 :了 三 a 十 bX; 十 by 六; ,剔除 了 自 变量 X ,变量 选择 方法 是 "Backward”; 

方程 二 :了 二 a 十 bX; ,剔除 了 自 变量 X; ,变量 选择 方法 是 “Backward”。 

(2) 回归 方程 的 拟 合 优 度 及 其 比较 。 本 例 中 输出 三 个 回归 方程 , 表 9 -10 所 显示 的 
数据 主要 是 用 于 对 三 个 方程 的 拟 合 优 度 进行 比较 ,以 判断 三 个 方程 的 优 劣 。 从 方程 的 判 
定 系数 R* 来 看 , 第 一 、 二 、 三 个 方程 的 判定 系数 相差 不 大 但 也 是 依次 减 小 的 。 前 文 已 
经 指出 , 自 变量 数量 的 变化 会 影响 到 判定 系数 的 大 小 , 在 多 元 线性 回归 分 析 中 , 更 主要 
的 是 看 调整 后 的 判定 系数 R, 表 中 数据 显示 第 三 个 方程 的 调整 后 的 尺 ==0. 650, 达 到 最 
大 ,所 以 第 三 个 方程 的 拟 合 优 度 最 高 。 


表 9-10 三 个 回归 模型 的 比较 (Model Summary) 





Model R R Square Adjusted R Square Std. Error of the Estimate 
1 . $820 .683 .597 .07387 
2 .826 .682 .629 1.02948 
4 .821 .675 .650 1. 00022 





(3) 回归 模型 有 效 性 的 方差 分 析 表 。 三 个 回归 模型 的 方差 分 析 结 果 如 表 9 -11 
所 示 。 


表 9-11 三 个 回归 模型 有 效 性 的 方差 分 析 表 








Model Sum of Squares df Mean Square F Sig. 

1 Regression 27, 322 3 9. 107 7. 902 .004 
Residual 12. 678 11 1. 153 

2 Regression 27. 282 2 13.641 12. 871 . DO] 
Residual 12.718 12 1.060 

3 Regression 26. 994 1 26.991 26. 983 .D00 
Residual 13. 006 13 1. 000 





表 9-11 中 的 结果 显示 ,三 个 回归 模型 的 方差 分 析 结 果 均 达到 显著 性 水 平 , 即 F 值 
的 显著 性 水 平均 达到 p 二 0.01, 说 明 三 个 方程 均 有 效 , 总 体 上 说 , 因 变 景 与 自 变量 之 间 存 
在 显著 性 的 线性 相关 ， 

(4) 回归 参数 的 显著 性 上 检验。 回归 参数 的 显著 性 检验 是 对 方程 中 的 所 有 回归 参数 
进行 显著 性 的 上 检验 ,以 显示 方程 中 各 部 分 对 预测 因 变 量 的 贡献 大 小 ,本 例 结 果 如 表 
9 一 12 所 示 。 

表 9-12 中 数据 显示 ,三 个 自 变 量 对 应 的 回归 系数 中 显著 性 最 低 且 远 未 达到 显著 性 
水 平 的 是 包 ,说 明 自 变量 X, 对 预测 因 变 量 的 贡献 不 大 ,于 是 将 其 从 方程 中 剔 除 形成 方程 
二 。 在 方程 二 中 ,回归 系数 中 显著 性 最 低 且 远 未 达到 显著 性 水 平 的 是 乌 , 说 明 自 变量 X: 
对 预测 因 变量 的 贡献 不 大 ,于 是 将 其 从 方程 中 剔除 形成 方程 三 。 方 程 三 中 只 琵 一 个 自 变 


蜗 , 而 且 它 的 回归 系数 达到 了 及 其 显著 性 的 水 平 ( 记 一 0. 001) 。 
表 9-12 回归 参数 及 其 显著 性 检验 (Coefficients) 








Unstandardized Coefficients Standardized Coefficients 1 Sig. 
Model B Std, Error Beta 

1 (Constant) 一 8. 143E 一 02 3. 328 一 024 .981 
Xl 3. 495E 一 02 ,188 .043 .186 .856 

X2 .791 .246 .746 3.217 .008 

X3 1.538E 一 02 .036 .089 .426 .678 

2 (Constant) "~. 237 3.089 OF :940 
X2 .814 . 204 .768 3.995 .002 

X3 1.729 下 一 02 .033 . 100 “S21 .612 

3 (Constant) 1. 253 1.136 1.103 .290 
X2 .871 .168 .821 5. 194 .000 





综合 以 上 结果 ,最 后 得 到 了 一 个 有 效 的 一 元 线性 回归 方程 :了 二 1. 253 十 0. 871X;。 其 
他 两 个 自 变量 因为 与 因 变 量 的 线性 相关 不 明显 ,对 其 预测 的 贡献 不 大 ,所 以 被 剔除 (本 例 
的 结论 源 自 假设 的 数据 ,所 以 不 可 当真 1) 。 


和 一 复习 思考 与 练习 题 一 一 op 


1. 试 分 析 回 归 分 析 和 相关 关系 的 区 别 与 联系 。 

2. 说 明 线性 回归 分 析 的 一 般 逻 辑 和 基本 程序 。 

3. 在 对 某 市 的 百货 商场 进行 抽样 调查 时 抽 中 了 10 家 商场 。 统 计 出 每 家 商场 前 一 个 
月 每 名 售货员 的 日 均 销售 额 (X: 千 元 ) 和 商场 的 净 艾 利率 (Y:%) ,于 是 得 到 表 9 - 13 中 的 
数据 。 试 建立 商场 月 要 利率 对 营业 员 日 均 销售 额 的 一 元 线性 回归 方程 并 检验 回归 方程 
的 有 效 性 。 车 营业 员 的 日 均 销 售 额 为 5000 元 时 ,那么 商场 月 盘 利 率 的 预测 区 间 是 怎样 
的 (a 二 0.05)? 


表 9-13 商场 营业 员 上 月 平均 的 日 销售 额 与 商场 月 净 盈 利率 







营业 员 平 均 的 日 销售 额 (X) 
商场 月 盘 利 率 (Y) 









12.6 10.4 16.8 18.5 3.0°8.1 16.3 12.3°6.2 66 


4. 某 研究 者 欲 建 立 一 个 线性 回归 方程 ,帮助 命题 者 估计 试题 难度 。 他 设想 试题 难度 
受到 试题 的 能 力 层次 ,内容 深度 和 试题 类 型 三 个 因素 的 影响 ,因此 把 每 个 因素 都 按 对 难 
度 影 响 强度 大 小 分 为 五 个 层次 并 加 以 界定 ,然后 对 20 道 抽样 试题 分 因素 评分 并 且 又 计 
算 了 这 20 道 试题 的 实际 难度 值 (以 标准 分 数 表示 ) ,数据 如 表 9 - 14 所 示 。 请 你 帮助 他 建 
立 一 个 估计 试题 难度 的 三 元 线性 回归 方程 。 
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囊 9-14 预测 试题 难度 数据 表 






能 力 。 内 容 题目 
序号 难度 层次 深度 类 型 








-EE 划 ta 王 
四 一 
WWM 
人 
nm 
i 


jp 
oS 


一 0.3 20 1.0 


ka 





第 十 章 因素 分 本 
Gass 


因素 分 析 是 基于 相关 关系 而 进行 的 数据 分 析 技 术 , 是 一 种 建立 在 众多 观测 数据 基础 
上 的 降 维 处 理 方法 ,其 最 主要 目的 是 探索 隐藏 在 大 量 观测 资料 背后 的 某 种 结构 ,寻求 一 
组 变量 变化 的 <“ 共同 因子 "。 因 素 分 析 的 一 般 程 序 是 :在 获取 一 系列 变量 的 观测 数据 后 ， 
通过 变量 间 的 相关 分 析 , 判 断 因 素 分 析 的 适合 度 ; 采 用 主 成 份 分 析 等 方法 进行 变量 转换 
或 新 变量 构建 ,寻找 相对 独立 的 、 能 较 好 解释 原 变量 变化 的 少数 几 个 新 变量 构成 公共 因 
子 , 并 以 原 变量 的 共同 度 、 因 子 载荷 的 结构 性 ,因子 的 可 解释 性 等 评估 因素 分 析 结 果 的 质 
量 . 计 算 因 子 分 。 本 章 还 详细 地 介绍 了 依靠 SPSS 系统 完成 因素 分 析 的 过 程 以 及 结果 的 
读 取 与 解释 。 


因素 分 析 是 伴随 着 心理 学 的 研究 而 发 展 起 来 的 。 从 最 初 斯 皮尔 曼 研究 人 的 能 力 结 
构 , 到 现在 进行 大 样本 的 心理 测量 ,因素 分 析 一 直 是 心理 学 领域 最 有 效 和 应 用 最 多 的 一 
种 资料 分 析 方 法 。 通 过 测量 的 方法 获得 一 个 样本 或 总 体 中 多 个 样本 的 一 系列 特征 值 后 ， 
我 们 往往 会 有 “信息 超载 "之 感 ,总 期 望 能 简化 信息 ,从 浩 繁 的 数据 中 发 现 某 种 结构 或 者 
问题 的 主要 方面 ,这 就 需要 使 用 因素 分 析 技 术 了 。 





人 的 心理 结构 具有 层次 性 。 有 些 成 分 是 表面 的 、 外 在 的 ;有 些 成 分 则 是 隐秘 的 、 内 在 
的 ,但 作为 具有 同一 性 的 个 体 来 说 ,内 隐 的 方面 总 是 和 外 显 的 方面 相互 作用 ,内 隐 方 面 制 
约 着 外 显 特征 。 所 以 我 们 经 常 说 ,一 个 人 的 内 在 自我 会 在 相当 程度 上 决定 他 的 外 在 行为 
特征 ,表现 为 某 些 行为 倾向 具有 高 度 的 一 致 性 或 相关 性 。 反 过 来 说 ,我 们 可 以 通过 对 个 
体 进行 系统 地 观察 和 测量 ,从 一 组 高 度 相 关 的 行为 倾向 中 ,探索 到 某 种 稳定 的 内 在 心理 
结构 ,这 就 是 因素 分 析 所 能 做 的 。 








第 一 节 ”因素 分 析 的 基本 原理 


一 、 因 素 分 析 的 基本 思想 与 起 源 


因素 分 析 (factor analysis) ,又 叫 因子 分 析 。 它 是 一 种 多 元 统计 分 析 方 法 ,可 以 用 来 
对 复杂 的 测量 数据 进行 化 简 ,其 产生 与 发 展 得 益 于 20 世纪 初 心理 学 家 对 智力 的 研究 。 
但 是 它 的 用 途 与 贡献 已 不 仅仅 局 限于 智力 等 心理 学 的 研究 领域 。 
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1904 年 ,英国 心理 学 家 查尔斯 .斯 皮尔 曼 (Chales Spearman) 发 表 了 一 箱 题 为 KGen- 
eral Intelligence, Objectively Determined and Measured》 的 论文 ,报告 他 采用 因素 分 析 的 
方法 对 智力 结构 所 进行 的 研究 ,提出 了 智力 的 “二 因素 说 ”, 即 认为 智力 是 由 一 般 因 素 和 
特殊 因素 构成 。 这 是 使 用 因素 分 析 方 法 的 起 点 。1925 年 后 ,关于 斯 皮尔 曼 因 素 分 析 的 研 
究 出 现 了 一 次 较 大 的 争论 ,人 们 开始 质疑 "二 因素 说 "的 正确 性 ,并 指出 其 中 的 一 些 不 足 。 
20 世纪 30 年 代 后 期 ,针对 二 因素 理论 的 不 足 , 美 国 心理 学 家 瑟 斯 顿 (L. 1. Thurstone) 等 
人 在 研究 中 提出 了 智力 的 “ 群 因素 理论 ”， 他 通过 旋转 因素 轴 的 方法 得 到 因素 的 简单 结 
构 , 认 为 :通过 旋转 的 方法 得 到 的 因素 可 以 是 相关 的 ,也 可 以 是 不 相关 的 。 如 果 因 素 是 相 
关 的 , 则 可 以 对 其 进行 再 次 分 析 , 得 到 所 谓 的 高 阶 因素 。 这 也 就 是 因素 分 析 “ 因 子 旋 
转 ” 与 “高 阶 因素 ”的 思想 。 二 战 期 间 , 琶 斯 顿 的 相关 理论 和 方法 对 美国 军队 人 才 的 选 
拔 提供 了 很 大 帮助 ,从 而 扩大 了 因素 分 析 方 法 的 影响 。 圳 尔 福特 (J. P. Guilford) 的 三 
维 智 力 理论 ,卡特 尔 (R. B，CattelD) 的 流体 和 晶体 智力 理论 、 弗 农 (P. E， Vernon) 的 智力 
如 次 结构 理论 等 都 是 通过 因素 分 析 的 方法 而 得 到 的 。 由 于 他 们 是 用 因素 分 析 的 方法 来 
探索 智力 的 构成 ,所 以 他 们 使 用 的 因素 分 析 方 法 又 被 称 为 探索 性 因素 分 析 (exploratory 
factor analysis)。20 世纪 60 年 代 中 后 期 ,统计 学 家 博克 (R. D. Bock) . 巴 格 曼 CR. Barg- 
mann) 以 及 乔 纳 斯 柯 格 (K. G. Jareskog) 研 究 了 因素 分 析 模 型 中 参数 的 假设 检验 问题 ,并 
发 展 出 了 验证 性 因素 分 析 (confirmatory factor analysis) 。 他 们 的 方法 重点 在 于 检验 先 
统 ”前 假设 的 因子 结构 是 否 合 适 , 从 而 弥补 了 探索 性 因素 分 析 的 不 足 。 因此 ,验证 性 因素 
计 分 析 越 来 越 受 到 人 们 的 重视 。 但 是 验证 性 因素 分 析 尚 处 于 发 展 阶 段 , 其 自身 还 存在 一 
与 ”此 不足。 
因素 分 析 不 仅 是 智力 研究 的 有 效 方法 ,也 是 心理 学 其 他 研究 领域 的 有 力 工具 。 例 
如 ,卡特 尔 关 于 人 格 特质 的 研究 , 艾 森 克 (H., Eysenck) 关 于 个 性 差异 的 研究 ,都 运用 了 
用 - 因素 分 析 方 法 。 到 了 20 世纪 70 年 代 , 探 索性 因素 分 析 在 方法 上 已 趋 于 成 熟 ,应 用 领域 
-。 也 扩展 到 态度 .兴趣 .学 习 等 方面 的 研究 。 另外 ,在 一 些 非 心理 学 领域 ,如 经 济 学 .医学 、 
% 物理 学 .社会 学 .地 域 科学 及 分 类 学 等 也 广泛 地 使 用 了 因素 分 析 方法 。 因此 ,有 人 甚至 将 
因素 分 析 称 为 心理 学 对 自然 科学 的 唯一 贡献 。 
因素 分 析 的 基本 思想 是 :在 众多 的 可 观测 变量 中 ,根据 相关 性 大 小 可 将 变量 进行 分 
组 ,使 同 组 内 的 变量 间 的 相关 性 较 高 ,不 同 组 的 变量 间 的 相关 性 较 低 ,从 而 使 每 组 变量 能 
够 代表 一 种 基本 结构 。 每 一 种 基本 结构 表示 为 一 种 公共 因子 , 即 “ 因 子 ”。 因此 ,因素 分 
析 的 目的 是 :用 少 基 的 “因子 " 概 括 和 解释 大 量 的 观测 变量”, 从 而 建立 起 简洁 的 .更 具有 
一 般 意义 的 概念 系统 。 
例如 ,对 某 班 20 名 学 生 进行 心理 测量 ,得 到 了 他 们 在 常识 .词汇 ,算术 ,积木 ,拼图 、 
阅读 理解 .图 片 排列 7 个 项 目 上 的 得 分 ,如 表 10 -1 所 示 。 这 7 个 项 目的 测验 得 分 反映 了 
学 生 的 哪些 能 力 呢 ? 每 个 学 生 的 能 力 又 是 怎样 的 呢 ? 
可 以 使 用 因素 分 析 的 方法 ,经 过 因子 抽取 、 因 子 数目 的 确定 ,因子 旋转 等 步骤 后 ,得 
到 包含 两 个 因子 的 相关 矩阵 。 其 中 一 个 因子 与 常识 .词汇 ,算术 ,阅读 理解 的 得 分 相关 较 
高 ,而 另 一 个 与 积木 、 拼 图、 图 片 排列 的 得 分 相关 较 高 。 根据 相关 经 验 , 把 两 个 “因子 ”分 
别 命名 为 “言语 智力 "和 “操作 智力 ”。 还 可 以 进一步 计算 这 两 种 智力 与 7 种 测验 得 分 的 
相关 和 矩阵 ,如 表 10 -2 所 示 。 
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表 10-1 某 班 20 名 学 生 7 项 测验 得 分 
拼图 阅读 理解 图 片 排列 





表 10-2 7 项 得 分 与 两 个 "因子 "的 相关 和 矩阵 


变量 /因素 言语 智力 操作 智力 
常 识 0. 927 一 0. 260 
词 汇 0. 883 —0.337 
， 、 0. 880 —0.332 
积 木 一 0. 342 0.820 
拼 一 0. 185 0.873 
阅读 理解 0. 905 一 0. 103 
图 片 排列 一 0. 190 0. 896 


表 10 - 2 数据 显示 ,言语 智力 "与 “常识 "“ 词 汇 " “算术 "“ 阅 读 理解 "四 项 的 相关 
都 非常 高 。 这 里 的 “言语 智力 ”是 我 们 所 说 的 “因子 ", 是 人 的 内 在 心智 结构 成 分 之 一 ' 制 
约 着 人 的 外 在 的 一 些 作 业 成 绩 , 所 以 它 与 "常识 "等 出 现 了 高 度 的 相关 ;同样 “操作 智力 ” 
也 是 人 的 内 在 的 心智 结构 成 分 之 一 ,制约 着 人 们 在 “积木 “拼图 "和 “图 片 片 列 " 等 项 目 
的 作业 成 绩 。 最 后 还 可 以 结合 计算 出 来 的 因子 得 分 ,评估 每 个 学 生 这 两 种 智力 的 发 展 
水 平 。 

简单 地 说 ,人 的 内 在 心理 结构 制约 着 外 在 的 行为 表现 ,外 在 的 行为 表现 则 反映 了 人 
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的 内 在 心理 结构 ,这 是 心理 学 使 用 因素 分 析 的 方法 进行 心理 结构 研究 的 基本 逻辑 基础 。 
二 、 因 素 分 析 的 基本 模型 


上 述 事 例 告诉 我 们 ,在 科学 研究 中 首先 获得 的 是 观测 资料 , 即 关于 事物 的 外 在 特征 
或 个 别 具 体 特征 的 资料 。 如 果 这 些 特 征 中 的 某 些 观 测 变量 存在 聚合 趋势 ,那么 它们 就 会 
具有 高 度 的 相关 性 ,这 种 高 度 相 关 性 意味 着 它们 的 背后 存在 着 共同 的 制约 因素 , 即 共同 
因子 。 如 果 能 够 在 一 批 多 维 数据 资料 中 找到 m 个 共同 因子 ,使 它们 可 以 解释 被 试 在 各 个 
观测 变量 上 所 表现 出 来 的 差异 性 (通常 将 其 称 为 变量 的 变异 性 ) ,就 可 以 使 用 这 较 少 的 m 





个 公共 因子 描述 原来 很 多 变量 才能 描述 的 事物 的 属性 。 所 以 ,因子 分 析 被 定义 为 :用 少 
数 几 个 因子 来 描述 许多 指标 或 因素 之 间 的 联系 ,以 较 少 几 个 因子 反映 原始 资料 中 大 部 分 








(一 ) 因素 分 析 的 代数 模型 
因素 分 析 的 基本 模型 是 将 一 系列 的 观测 变量 表示 成 几 个 假设 的 公共 因子 的 线性 
组 合 。 
例如 :在 个 被 试 组 成 的 样本 中 进行 一 系列 测量 ,获得 了 p 个 变量 的 数据 。 假 定 有 
m 个 公共 因子 的 个 体 差异 可 以 解释 被 试 在 各 个 观测 变量 中 表现 出 来 的 大 部 分 变异 ,那么 
个 变量 就 都 可 以 表达 成 由 这 mm 个 因子 组 成 的 回归 方程 式 : 
Xi =anF+taw PF; 二 *TanF ,+e 
Xi 一 do 下 十 ar 下 十 十 az F ,es 


X 一 di F, 十 aiz F; 十 "十 Gin 


XanFltamFs .+apmF ,te, 

这 一 组 方程 中 ,XX , XX; ,… ,Xp 分 别 表 示 某 被 试 在 第 一 ,第 三、…, 第 p 个 观测 项 目 上 
的 得 分 , 且 以 标准 分 来 计 ; Pi ,FF;,… ,FF 分 别 表 示 这 个 被 试 在 m 个 公共 因子 上 的 得 分 ,也 
是 以 标准 分 来 计 ;a; 表示 第 i 个 观测 变量 对 应 的 回归 方程 中 第 j 个 公共 因子 的 系数 ,是 计 
算 X; 的 回归 方程 中 对 应 于 第 j 个 因子 的 加 权 系 数 , 称 为 因子 载荷 。 因 子 对 某 一 观测 变量 
的 影响 力 越 大 ,在 计算 该 变量 时 给 予 的 加 权 就 越 大 , 即 对 应 的 因子 载荷 就 越 大 。 

但 是 ,此 处 所 说 的 “因子 对 某 一 观测 变量 的 影响 力 ” 仅 仅 是 为 了 表述 的 方便 ,并 不 是 
说 第 7 个 因素 就 是 引起 第 i 个 变量 变化 的 原因 。 因子 分 析 中 所 提取 的 因子 只 是 一 种 假设 
的 存在 , 它 是 为 了 说 明 变 量 之 间 的 相关 关系 。 至 于 这 些 因子 在 现实 中 有 何 意义 , 则 是 因 
子 命名 与 因子 解释 的 任务 ,我 们 在 后 续 的 部 分 再 加 以 讨论 。 

还 可 以 将 因素 分 析 的 基本 模型 表示 成 矩阵 的 形式 , 即 :X=AFTe。 其 中 : 
X=(X, Xs, ,XPF=(F,,F,,.. 一 (El vEz ,°° Ep) 


Ul Ul 





失 阵 A 包含 了 因素 分 析 模型 中 所 有 的 因子 载荷 ,所 以 也 叫做 因子 载荷 矩阵 ， 该 算 阵 
的 每 一 个 元 素 a; 都 是 某 一 个 观测 变量 与 某 一 个 公共 因子 之 间 的 相关 系数 ， 

统计 学 研究 要 求 因素 分 析 的 数学 模型 满足 以 下 两 个 条 1) 公 共 因 子 以 标准 分 表 
示 , 其 平均 数 为 0, 方差 为 1;(2) 公 共 因 子 间 相互 独立 ,其 协 为 m 阶 单位 阵 ( 对 角 
线 上 的 元 素 均 为 1, 非 对 角 线 上 的 元 素 均 为 0 的 矩阵 )。 






(二 ) 变量 的 共同 度 
方差 反映 了 数据 的 变化 程度 。 第 i 个 测验 的 分 数 X, 的 方差 反映 了 被 试 在 第 ; 个 测验 
中 反应 的 差异 性 大 小 。 该 差异 是 怎样 产生 的 呢 ? 因素 分 析 假 设 : 每 个 测量 变量 都 受到 公 
共 因 子 和 随机 误差 的 影响 。 因 此 ,X; 的 方差 可 以 分 解 成 公共 因子 的 方差 和 误差 方差 两 个 
独立 的 部 分 。 
因素 分 析 期 望 找 到 的 是 相互 独立 的 公共 因子 。 因 此 ,由 因素 分 析 的 基本 模型 X,= 
aa 忆 i 二 az 忆 十 asFj; 十 …aiwF ,十 e, 可 以 推导 出 第 i 个 变量 的 方差 为 : 
=ah toast rab rd =A td=] (公式 10-1) 
其 中 , 为 第 ;个 变量 的 方差 。 当 这 个 变量 和 方程 中 的 因子 均 以 标准 分 来 计 的 时 候 ， 
其 方差 为 1。a3 , 叶 ,ve 分别 为 第 1,2,…,m 个 公共 因子 对 义 ;的 方差 贡献 。d; 为 第 i 
个 变量 中 其 他 误差 因素 的 方差 贡献 。 将 变量 X, 对 应 的 公共 因子 的 方差 总 和 hh; 称 为 变量 
X ,的 共同 度 。 即 : 
有 二 a 十 a 十 … 十 ai， (公式 10 -2) 第 
见 ,共同 度 尼 为 所 有 公共 因子 对 变量 六 ;方差 的 总 贡献 量 ,反映 了 X; 的 变异 中 能 
被 所 有 公共 因子 共同 解释 的 部 分 。 所 以 可 将 “共同 度 ” 理 解 为 “所 有 因子 对 这 个 变量 共同 
起 作用 的 程度 ”, 它 在 数值 上 等 于 因子 载荷 矩阵 中 第 i 行 因子 载荷 的 平方 和 。 以 表 10-2 条 
中 的 因子 载荷 矩阵 为 例 . 表 中 有 ?7 个 测验 项 目 、 两 个 公共 因子 “言语 智力 "和 “操作 智力 ”。 村 
就 测验 项 目 * 算 术 "来 说 , 它 的 共同 度 就 等 于 司 一 ai 十 d 一 0.880: 十 (一 0.332)? 一 0.885。 8 
这 就 等 于 是 说 :被 试 在 * 算 术 " 测 验 中 的 个 人 差异 有 88. 5% 是 由 于 他 们 在 “言语 智力 "和 有 
“操作 智力 ”两 方面 的 差异 带 来 的 , 男 有 11. 5 坚 的 个 人 差异 是 其 他 因素 带 来 的 ， 其 中 "* 言 


Pp 


语 智力 ”的 贡献 更 大 ,为 77.4%( 因 0. 880? 二 0.774) ,是 被 试 在 "算术 ”测验 中 成 绩 差异 的 
主要 原因 。 

很 明显 ,因素 分 析 希 望 能 用 找到 的 m 个 公共 因子 解释 测量 变量 绝 大 部 分 的 变异 , 即 
测量 变量 的 共同 度 要 比较 高 , 越 接 近 于 1 越 好 。 变 量 的 共同 度 成 为 评估 因素 分 析 效 果 优 
劣 的 重要 指标 。 


(三 ) 公共 因子 的 方差 贡献 
因子 载荷 中 的 第 j 列 是 第 j 个 公共 因子 与 所 有 测量 变 基 的 相关 系数 或 载 符 ， ea 


和 代表 了 这 个 公共 因子 对 所 有 测量 变量 方差 贡献 总 和 ,叫做 该 公共 因子 的 方差 页 
献 。 即 : 
太一 > (公式 10 -3) 
妃 反映 了 公共 因子 F; 对 所 有 测量 变量 的 总 的 影响 ,同时 也 体现 了 公共 因子 FF 在 所 
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有 公共 因子 中 的 相对 重要 性 。 由 表 10 -2 可 知 : 

“言语 智力 ”因子 的 方差 贡献 为 :研一 0.9272 十 0. 883: 十 … 十 (一 0. 190)2 一 3. 42 

“操作 智力 ”因子 的 方差 贡献 为 :研一 (一 0. 260)2 十 (一 0. 337): 十 … 十 0. 896? 一 2. 54 

因为 该 例 中 有 ?7 个 测量 项 目 . 所 以 总 的 变异 量 为 7。 两 个 因子 的 方差 两 献 总 和 为 
5.96, 占 到 总 变异 量 的 85. 1%6 ,那么 另 有 14.9% 是 由 其 他 因 案 带 来 的 ,可 笼统 地 将 这 一 
部 分 归 为 误差 因素 。 如 果 要 计算 各 因子 的 方差 贡献 率 , 则 用 其 方差 贡献 除 以 变量 的 数 
量 , 本 例 中 : 

“言语 智力 ”的 方差 贡献 率 等 于 : 3. 42 计 7 二 0. 489 二 48. 9% 

“操作 智力 "的 方差 贡献 率 等 于 : 2. 54 二 7 二 0. 363 一 36. 3% 

相对 而 言 ,由 于 “言语 智力 ”的 方差 页 献 更 大 ,所 以 “言语 智力 ” 比 “ 操 作 智 力 ” 对 7 项 
测验 的 影响 大 。 或 者 说 ,在 解释 被 试 在 7 项 测验 上 的 分 数 差 异 方面 ,* 言 语 智力 ”的 解释 
力 更 强 。 


三 、 因 素 分 析 的 基本 步骤 


因素 分 析 的 主要 步骤 是 :(1) 因 素 分 析 适 合 度 检 验 , 确 定 获 取 的 测量 数据 是 否 适 合 于 
进行 因素 分 析 ;(2) 构 造 因 素 模型 并 确定 因子 数量 ,主要 涉及 因素 提取 和 因子 数 的 确定 ; 
(3) 因 子 旋 转 , 通 过 正 交 旋转 或 者 斜 交 旋转 使 得 因素 模型 的 意义 更 加 明确 ;(4) 因 子 得 分 
的 计算 ,以 及 因子 的 命名 与 解释 。 下 面 根据 因素 分 析 的 一 般 过 程 ,对 其 各 个 阶段 的 任务 
进行 介绍 。 


第 二 节 ”因素 分 析 的 适合 度 检验 


因素 分 析 通 常 是 从 计算 变量 的 相关 矩阵 开始 的 ,所 以 要 先 计 算 变 量 间 的 相关 矩阵 来 
进行 因素 分 析 适 合 度 检 验 。 若 发 现 变量 间 的 相关 度 普遍 偏 低 ,如 :大 部 分 相关 系数 的 绝 
对 值 低 于 0. 3 且 没 有 通过 显著 性 检验 , 则 说 明 这 些 变 量 间 的 结构 松散 ,也 很 难得 到 有 效 
的 公共 因子 或 实现 对 数据 的 简化 ,就 不 适合 因素 分 析 。 

基于 变量 间 的 相关 ,还 可 以 变换 出 其 他 一 些 适合 度 检验 的 方法 ,常用 的 有 三 种 。 

1 . 巴 兰 刊 兰 球形 直 内 ( Bartiett-test of sphericity ) 

巴特 利 特 球形 检验 以 原 有 变量 的 相关 和 矩阵 为 出 发 点 ,提出 虚无 假设 H,:“ 相 关系 数 
定 阵 是 一 个 单位 阵 ”, 即 相关 系数 矩阵 对 角 线 上 的 所 有 元 素 都 为 1, 非 对 角 线 上 的 元 素 都 
为 0。 其 统计 量 是 根据 相关 系数 矩阵 的 行列 式 计 算得 到 ,并 且 近 似 地 服从 卡 方 分 布 。 如 
果 检 验 统计 量 较 大 , 且 其 对 应 的 概率 户 值 小 于 给 定 的 显著 性 水 平 , 则 应 拒绝 虚无 假设 
万 , ,认为 原 有 变量 的 相关 系数 矩阵 不 是 单位 阵 , 变 量 间 存 在 显著 的 相关 关系 ,可 以 进行 因 
素 分 析 ; 反 之 , 则 接受 虚无 假设 H, ,认为 变量 的 相关 和 矩 阵 是 单位 阵 , 变 量 之 间 的 相关 度 很 
低 或 没有 相关 ,不 适合 于 因素 分 析 ， 

2. 友人 个 配 关 逢 懈 检 验 ( Anti-image correlation matrix ) 

反 像 相关 矩阵 检验 以 变量 间 的 偏 相 关 和 矩阵 为 出 发 点 ,在 消除 或 隔离 了 其 他 变量 的 影 
响 的 条 件 下 ,计算 两 个 变量 间 的 偏 相 关系 数 。 反 像 相 关 和 矩阵 中 每 个 元 素 的 偏 相关 系数 均 


为 负数 。 所 以 ,如 果 确 实 存在 公共 因子 ,或 者 说 变量 间 存 在 较 多 的 重 胎 影响 ,那么 排除 了 
这 些 公共 公共 因子 的 影响 之 后 ,变量 间 的 相关 就 会 比较 小 ,所 得 到 的 偏 相 关系 数 也 应 该 
很 小 。 相 反 , 如 果 反 像 相 关 和 矩阵 中 有 些 元 素 的 绝对 值 比较 大 ,说 明 这 些 变 量 受 其 他 变量 
重 迭 的 影响 就 比较 小 ,没有 存在 公共 因子 的 明显 证 据 , 那 么 这 些 变量 就 不 太 适 合 于 因素 
分 析 。 
时 合 度 雁 验 (Kaiser-Meyer-OIkin measure of sampling adequacy ) 
KMO 取样 适合 度 检 验 是 将 观测 变量 间 的 相关 矩阵 与 偏 相 关 和 矩阵 相 结合 的 检验 方 
法 。 可 以 设想 :如 果 变 量 间 相 关 和 矩阵 中 元 素 的 绝对 值 比较 大 , 偏 相 关 和 矩阵 中 元 素 的 绝对 
值 也 比较 大 ,那么 二 者 比较 可 知 两 两 变量 间 的 关系 受 其 他 变量 影响 就 少 ,存在 公共 因子 
的 可 能 性 较 低 ,不 适合 做 因素 分 析 ; 如 果 变 量 间 相关 矩阵 中 的 元 素 的 绝对 值 比较 大 , 偏 相 
关 和 矩阵 中 的 元 素 的 绝对 值 却 比较 小 ,那么 二 者 比较 可 知 两 两 变量 间 的 关系 受 其 他 变量 影 
响 明 显 ,存在 公共 因子 的 可 能 性 较 高 ,适合 做 因素 分 析 。 于 是 统计 学 家 提出 如 下 公式 计 
算 KMO 指标 ,以 其 大 小 来 判断 是 否 适合 做 因素 分 析 。 
KMO Pg 公式 10 -4) 
5 5 + 不 5 (公式 

公式 中 ,mm 是 变量 X, 和 其 他 变量 XiG 天 说 间 的 相关 系数 , 思 是 变 贡 Xi 和 其 他 变量 
X,(j 关 让 的 偏 相关 系数 。 如 果 变 量 间 的 相关 系数 绝对 值 远 远大 于 偏 相关 系数 的 绝对 值 ， 
那么 KMO 就 应 该 接近 于 1 ,说 明 这 些 变量 之 间 存 在 着 明显 的 相关 关系 ,可 以 进行 因素 分 
析 ; 反 之 ,如 果 变 量 间 相 关系 数 绝对 值 相 对 于 偏 相 关系 数 绝对 值 较 小 ,那么 KMO 值 就 接 
近 于 0, 反映 这 些 变 量 间 的 相关 受 其 他 变量 重合 影响 较 小 ,不 适合 做 因素 分 析 。 

Kaiser 根据 研究 经 验 , 给 出 了 一 个 比较 常用 的 判断 是 否 适 合 因素 分 析 的 KMO 度量 
标准 : 

KMO-0.9, 非 常 适合 ; 

0. 8 一 KMO 一 0.9 ,适合 ; 

0.7 一 人 MO 一 0. 8 ,一 般 ; 

0.6 一 KMO 一 0.7, 不 太 适 合 ; 

KMO 一 0. 5, 极 不 适合 。 







第 三 节 ”因子 提取 与 因子 数 确定 


因素 分 析 的 基本 目标 是 找 出 少数 几 个 公共 因子 ,使 这 些 因子 能 够 在 相当 程度 上 解释 
一 系列 变量 的 数据 变异 。 因 此 ,如 何 抽取 因子 .以 及 抽取 几 个 因子 便 成 为 因素 分 析 中 的 
基本 问题 。 


一 、 因 子 提 取 的 方法 


因素 提取 的 方法 有 很 多 种 .使 用 最 多 的 是 主 成 份 分 析 法 。 此 外 还 有 最 小 二 乘法 
(least squares) , 极 大 似 然 法 (maximum likelihood) ,a 因子 法 (alpha factoring) ,映像 分 析 
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法 (image factoring) 等 这 里 主要 介绍 主 成 份 分 析 法 。 
主 成 份 分 析 法 (principal components) 对 数据 总 体 的 分 布 没有 什么 特别 限制 ,因此 使 
用 范围 很 广 , 是 因素 分 析 中 最 常用 的 一 种 因子 提取 方法 。 研 究 中 ,获取 了 原 变 量 的 数据 
之 后 ,通过 数学 方法 将 给 定 的 一 组 相关 变量 表示 成 另外 一 组 相互 独立 的 变 基 的 线性 组 
合 .这 一 组 相互 独立 的 变量 就 叫做 主 成 份 。 这 些 主 成 份 可 以 按照 其 方差 贡献 的 递减 顺序 
排列 。 
若 要 建立 主 成 份 与 各 相关 变量 的 线性 组 合 , 设 户 个 相关 观测 变量 X,Xz,…,Xr, 经 
过 线性 组 合 后 转化 为 一 组 相互 独立 的 变量 FF ,F:,…,F, ,可 以 表示 为 : 
Fl=bn Xi 二 Tb Xs 二 bX 
Fy 一 各 Xi bn Xi =b,X, 
a 
其 中 :(1)F; 与 FF 相互 独 立 ;(2)F; 是 以 标 淮 分 来 计 , 所 以 其 方差 等 于 1, 即 后 十 的 
十 … 十 如 一 1;(3) 在 计算 原 变量 的 线性 组 合 中 , Fi ,FF ,… ,FF, 的 方差 贡献 依次 减 小 ,所 以 
将 它们 分 别称 为 原 有 变量 的 第 一 主 成 分 、 第 二 主 成 分 … .第 p 主 成 分 。 其 中 ,第 一 主 成 
分 下 对 原 变 量 X 、X: 、…* .Xb 的 解释 能 力 最 强 , 其 余 各 主 成 份 FF 、…、F, 对 原 变 量 的 
解释 能 力 依 次 减 小 。 
为 了 达到 减少 变量 的 目的 ,一 般 只 选取 前 面 几 个 方差 贡献 较 大 的 主 成 分 。 这样 既 实 
现 了 对 原 变量 的 简化 ,又 最 大 限度 地 保持 了 对 原 有 变量 变异 信息 的 解释 力 。 
主 成 分 分 析 的 几何 解释 是 :对 Xi 、X: 、…、Xp 组 成 的 坐标 系 进行 移动 ,使 得 新 坐 
标 系 原点 和 数据 群 点 的 重心 相 重 合 。 并且, 在 新 坐标 系 中 ,数据 在 第 一 坐标 轴 上 的 差 
异 最 大 ,在 第 二 坐标 轴 上 的 差异 次 之 , 依 此 类 推 。 坐标 轴 之 间 相 互 垂直 ,从 而 反映 出 两 
个 主 成 份 之 间 的 相互 正 交 关系 , 即 二 者 不 相关 。 为 便于 理解 , 举 一 个 二 维 坐 标 变换 的 
例子 。 
假设 :在 一 个 被 试 样本 中 进行 了 两 项 变量 的 测量 ,得 到 了 两 个 变量 的 数据 资料 。 那 
么 ,如 果 以 这 两 个 变量 数值 描述 被 试 之 间 的 差异 ,就 相当 于 是 在 一 个 二 维 坐 标 系 中 描述 
被 试 的 差异 。 如 果 这 两 个 变量 存在 相关 ,我 们 使 用 其 中 一 
| 个 变量 值 时 就 会 受到 第 二 个 变量 的 影响 。 为 此 采用 主 成 分 
方法 转换 出 两 个 新 的 相互 独立 的 变量 局 、F,。 这 种 转换 的 
何 意义 可 以 表达 为 图 10 -1 所 示 的 形式 ,新 的 坐标 系 是 ， 
两 个 相互 独立 的 主 成 分 构成 的 。 

10 -1 显示 ,两 个 原 变量 存在 明显 的 线性 相关 ,而 新 
量 主 成 分 PF、F;: 具 有 相互 独立 性 。 其 中 Fi 坐标 设 在 原 
变量 变化 最 大 的 方向 上 ,图 中 散 点 在 FF 坐标 方向 的 分 布 范 
围 最 大 ,所 以 FF 方差 最 大 ,在 散 点 分 布 上 的 解释 力 最 强 , 也 
就 是 在 解释 两 个 原 变 量变 异 方面 页 献 最 大 ,被 称 为 第 一 主 
成 分 ; 相 比 较 而 言 ,F; 就 是 第 二 主 成 分 。 

使 用 主 成 分 分 析 方 法 或 其 他 方法 进行 变量 的 线性 变换 后 ,得 到 一 系列 方差 贡献 力 大 
小 不 等 的 新 变量 ,然后 从 中 依次 确定 能 够 对 解释 原 变 量变 异 信息 做 出 最 大 贡献 的 若干 












因子 。 
根据 因素 分 析 的 数学 模型 : 
X=anF ta Ft 
我 们 知道 :因子 载荷 矩阵 的 第 一 列 










mwFnte(i=1,2,.°,p) 
载荷 平方 和 ( 即 一 嘻 十 呈 十 … 十 an ) 反 映 
了 第 一 个 因子 对 所 有 变量 的 方差 总 贡献 或 总 影响 ,第 二 列 因 子 载荷 平方 和 ( 即 ;三 ats 十 
避 十 … 十 zz) 反映 了 第 二 个 对 所 有 变量 的 方差 总 贡献 或 总 影响 ; 依 此 类 推 。 每 一 列 
应 因子 的 方差 贡献 ,反映 了 该 因子 的 主要 特征 ,所 以 也 叫做 该 
式 为 : 
=atj; 二 a 十 二 ay (公式 10 -5) 

于 是 就 有 和 宇 4… 主 4,。 根 据 特 征 值 ,抽取 对 所 有 原 变 量 方差 贡献 最 大 的 一 个 作为 
第 一 因子 Ff ;抽取 方差 贡献 第 二 的 作为 第 二 因子 F;,…，, 如 此 依次 抽取 前 m 个 因子 。 使 
它们 的 方差 贡献 总 和 在 所 有 变量 的 方差 总 和 中 占有 较 大 的 比例 ,并 将 它们 作为 公共 
因子 。 


二 、 因 子 数 的 确定 


在 抽取 公共 因子 的 时 候 .我们 需要 解决 另外 一 个 问题 :抽取 几 个 公共 因子 才 算 合适 ? 

每 个 因子 的 解释 能 力 都 是 有 限 的 , 它 只 能 反映 原 变量 中 一 部 分 的 变化 信息 。 变 其 的 
剩余 变异 只 能 用 其 他 的 因子 来 解释 。 因 此 ,抽取 的 公共 因子 数目 越 多 ,因素 模型 所 能 解 
糙 的 变异 就 越 多 ,我 们 所 得 到 的 因素 模型 就 越 精确 ;抽取 的 公共 因子 数目 越 少 ,因素 模型 
的 解释 能 力 就 越 小 , 它 所 遗漏 的 变异 信息 就 越 多 。 如 果 将 所 有 的 主 成 份 全 部 选 为 因子 ， 
则 因子 数 与 原 变量 数 相同 ,这 时 虽然 能 完全 地 解释 原 变量 的 变异 信息 ,但 却 失去 了 因素 
分 析 的 意义 。 提 取 的 公共 因子 数 太 多 ,就 不 能 达到 简化 变量 结构 的 目的 。 所 以 ,在 确定 
因子 数 时 ,我 们 需要 在 因素 模型 的 准确 性 和 简单 性 之 间 做 较 好 的 权衡 。 

琶 斯 顿 (L.L. Thurstone) 兽 提 出 一 个 因子 数 与 原 变量 数 的 关系 式 : m 三 
(2 二 DD 二 V8 二 1 ， 革 中 m 为 要 提取 的 因 于 数 .n 为 原 变量 数 。 该 计算 式 反映 了 公共 因 
子 方差 未 知 时 变量 和 必要 的 因子 数 之 间 的 数量 关系 。 但 是 该 公式 也 只 是 一 个 经 验 公式 ， 
并 不 能 保证 普遍 有 效 。 

概括 地 说 ,确定 因子 数目 的 常用 方法 主要 有 以 下 几 种 : 

(1) 使 抽取 的 m 个 因子 对 原 变量 方差 的 解释 率 达到 一 个 适当 的 比例 。 一 般 建议 或 
要 求 达到 80% 以 上 。 但 在 实际 应 用 中 ,根据 问题 性 质 和 测量 工具 的 成 熟 水 平 ,也 可 以 将 
标准 定 为 40% 一 60% 这 一 较 低 的 水 平 。 

(2) 从 前 述 讨论 知道 ,因子 的 特征 值 与 其 方差 贡献 具有 对 应 关系 。 要 求 前 m 个 因子 
的 方差 贡献 总 和 达到 一 定 比例 ,就 等 于 是 要 求 前 m 个 因子 的 特征 值 总 和 达到 一 定 的 量 。 
换 句 话说 ,选取 的 因子 的 特征 值 应 该 达到 一 定 的 量 , 通 常 是 以 特征 值 大 于 1 为 默认 标 
准 。 特 征 值 代表 某 一 因素 对 所 有 变量 变异 的 方差 贡献 , 它 在 数值 上 等 于 该 列 因 子 载荷 的 
平方 和 。 特 征 值 越 大 ,说 明 因子 对 所 有 原 变量 的 解释 力 或 影响 力 越 大 ;特征 值 越 小 ,说 明 
因子 对 所 有 原 变量 的 解释 力 或 影响 力 越 小 ， 因 为 标准 化 后 的 每 个 原 变 量 的 方差 为 1, 屠 
么 低 于 1 的 特征 值 就 表明 一 个 因子 所 能 解释 的 变异 信息 比 一 个 标准 化 的 原 变量 的 变异 
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信息 还 少 。 我 们 就 不 能 借助 于 这 样 的 因子 达到 简化 变量 的 目的 ,所 以 说 ,这 个 因子 就 没 
有 太 大 的 意义 。 选 择 出 来 作为 公共 因子 的 变量 ,其 特征 值 要 大 于 1。 
(3) 通过 碎 石 检验 确定 因子 数 。 如 图 10 -2 是 一 个 碎 石 图 ,该 图 中 , 横 轴 表示 因子 序 
号 ,序号 编排 按照 方差 贡献 或 特征 值 大 小 ,贡献 大 的 排 在 左边 ; 纵 轴 表 示 每 个 因子 特征 什 
。 的 大 小 。 最 左边 的 一 个 因子 特征 值 最 大 ,所 
以 其 对 应 的 坐标 点 最 高 ;后 续 因 子 的 特征 值 
迅速 减少 ,所 以 曲线 也 迅速 下 降 。 曲 线 下 降 
到 某 一 因子 之 后 开始 变 得 平缓 。 曲 线 平 缓 , 意 
味 着 对 应 部 分 的 各 个 因子 的 贡献 比较 接近 ,或 
者 说 比较 平均 ,它们 在 简化 变量 的 过 程 中 帮助 
不 大 ,所 以 一 般 不 再 将 其 选 作 公共 因子 。 简 单 
地 说 ,依据 碎 石 图 来 确定 因子 数 , 一 般 是 以 碎 
石 曲线 从 迅速 下 降 到 突然 变 平缓 的 那个 拐点 
对 应 的 因子 数 来 确定 的 。 如 图 10 - 2 所 示 ， 
图 10-2 根据 竺 石 图 确定 国 子 数 示意 加 可 以 考虑 提取 两 个 公共 因子 。 
(4) 前 述 的 方法 都 是 完全 依据 数据 来 确定 因子 数 的 。 在 任何 学 科 的 研究 中 ,采用 定 
量 方法 的 同时 ,都 需要 注意 结合 定性 的 方法 。 所 以 ,在 确定 因子 数 时 ,研究 者 也 需要 结合 
自己 的 研究 经 验 .相关 专 业 知识 或 某 一 理论 假设 ,进行 综合 分 析 。 实 际 研究 中 ,众多 变量 
的 相互 关系 并 不 明确 ,所 以 ,综合 分 析 需 要 一 定 的 专业 素养 作为 前 提 。 
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第 四 节 因子 旋转 


一 、 因 子 旋转 的 意义 


经 过 前 面 的 一 系列 步骤 ,就 可 以 确定 合适 的 因子 数 和 因子 载荷 。 然 而 ,在 实际 研究 
中 ,初始 的 因子 载荷 矩阵 所 表示 的 含义 往往 不 明确 。 如 果 各 列 因 子 载荷 的 各 个 负荷 值 之 
间 没 有 明显 差异 ,就 很 难 将 原 变量 进行 分 类 ,也 很 难 区 分 其 与 公共 因子 的 对 应 关系 。 倘 
若 能 够 使 每 个 变量 在 某 一 个 因子 上 具有 高 负荷 ,而 在 其 他 各 因子 上 有 较 低 的 负荷 ,那么 
对 变 贡 进行 分 组 就 变 得 较为 容易 , 且 能 识别 出 与 其 相关 的 公共 因子 。 为 达到 这 种 目的 ， 
我 们 需要 对 初始 的 因子 载荷 窃 阵 进行 相应 的 因子 旋转 。 因 子 旋转 就 是 将 抽取 的 因子 结 
构 经 过 数学 变换 ,使 各 因子 能 够 清楚 地 分 离 ,凸显 其 特定 的 意义 。 

如 图 10 -3 所 示 , 当 因子 分 析 得 到 因子 1 和 [后 ,各 个 变量 的 特征 就 可 以 利用 其 在 两 
个 因子 上 的 载荷 值 来 描述 。 以 载荷 值 作为 坐标 值 时 ,就 可 以 将 原 变量 表示 成 两 个 因子 构 
成 的 二 维 坐标 系 中 的 散 点 ,如 图 10 - 3 中 的 a 图 所 示 。 很 明显 ,在 a 图 所 示 的 两 个 初始 因 
子 构成 的 坐标 系 中 ,如 果 各 点 的 两 个 坐标 值 相差 不 大 ,就 不 好 区 分 哪 一 个 因子 能 更 多 地 
解释 哪 一 些 变量 ( 散 点 ) 的 变化 。 于 是 对 这 个 二 维 坐标 系 进行 正 交 旋 转 , 即 两 个 坐标 轴 作 
同样 角度 和 方向 的 旋转 得 到 两 个 新 的 坐标 轴 , 构 成 了 新 的 坐标 系 ,如 图 10 -3 中 的 b 图 所 
示 。 在 正 交 旋 转 后 得 到 的 坐标 系 工 、 工 中 ,部 分 散 点 汇聚 在 工 轴 附近 ,其 他 散 点 汇聚 在 


[[' 轴 附近 。 将 它们 在 新 坐标 系 中 的 坐标 值 列 出 ,就 得 到 了 新 的 因子 载荷 矩阵 ,而 新 的 载 
荷 矩 阵 中 的 载荷 值 发 生 了 分 化 。 比 如 ,图 中 点 2 对 应 于 工 "的 坐标 值 很 大 、 对 应 于 贡 的 化 
标 值 很 小 ,所 以 点 2 对 应 的 变量 在 旋转 后 的 因子 I 上 载荷 很 大 、 在 旋转 后 的 因子 "上载 
荷 很 小 。 同 样 道理 ,变量 1.3.4.5.6 也 是 在 旋转 后 因子 了 上 载荷 大 ,而 在 旋转 后 因子 |" 
上 载荷 小 ;变量 7.8.9 .10 正好 相反 。 于 是 将 变量 1 一 6 归属 于 因子 1、 变量 7 一 10 归属 
于 因子 工 。 





图 10-3 因子 的 正 交 旋转 示意 图 
可 见 , 因 子 的 正 交 旋转 可 以 实现 因子 载荷 的 两 极 分 化 ,得 到 更 为 有 效 的 新 的 因子 模 
型 ,而 这 些 因 子 对 原 变 量 的 解释 更 为 明确 ,更 容易 显示 出 因子 本 身 的 内 涵 , 使 之 更 容易 
命名 。 


二 、 因 子 旋转 的 原则 


如 上 所 述 ,因子 旋转 旨 在 改善 因子 载荷 矩阵 ,凸显 因子 的 意义 。 统 计 学 中 有 多 种 因 
子 旋转 方法 ,而且 即使 同一 种 旋转 方法 也 可 以 得 到 多 种 解 。 那 么 如 何 选择 更 为 有 效 的 因 
子 旋转 结果 呢 ? 瑟 斯 顿 曾经 提出 了 五 条 * 简 单 结构 原则 ”, 即 在 没有 其 他 标准 可 依 的 情况 
下 ," 结 构 简 单 ,意义 明确 ?就 是 确定 因子 旋转 解 的 标准 。 对 瑟 斯 顿 的 五 原则 作 进 一 步 的 
简化 后 得 到 以 下 原则 

(1) 在 各 因子 上 ,只 有 少数 的 变量 具有 较 高 的 载荷 ,其 他 变量 载荷 的 绝对 值 均 较 低 ; 

(2) 每 个 变量 只 在 少数 几 个 因子 上 具有 较 高 的 载荷 ; 

(3) 任 取 两 个 因子 ,同时 在 两 个 因子 上 载荷 都 比较 低 的 变量 应 该 尽 基 多 一 些 ; 

(4) 任 取 两 个 因子 ,每 个 变量 只 能 在 一 个 因子 上 具有 较 高 的 载荷 。 


三 、 因 子 旋转 的 方法 


(一 ) 正 交 旋 转 

正 交 因子 旋转 可 以 通过 旋转 因子 轴 来 达到 简化 因子 结构 的 目的 ,从 而 使 各 个 因子 的 
含义 更 为 清晰 ,便于 因素 结构 的 解释 。 在 编制 测验 的 过 程 中 ,利用 正 交 旋转 探 明 其 表 结 
构 , 可 以 为 量 表 的 进一步 修订 提供 很 大 帮助 。 正 交 旋 转 方法 假设 各 个 因子 间 没 有 相关 关 
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系 , 因 此 ,在 旋转 过 程 中 ,各 因子 轴 之 间 保 持 90" 的 夹 角 不 变 ( 如 图 10 -3 所 示 ), 正 交 旋 转 ， 


也 因此 得 名 。 
因素 分 析 中 ,比较 常用 的 正 交 旋转 方法 是 方差 极 大 化 (Varimax)。 这 种 方法 力图 使 
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各 因子 上 的 因子 载荷 出 现 分 化 或 差异 极 大 化 , 即 方差 最 大 。 通 俗 地 说 ,就 是 使 大 的 
更 大 ,小 的 更 小 ,加 大 每 一 列 上 各 变量 的 载 胡 使 相关 和 抢 阵 中 的 变异 尽 可 能 地 分 散 


到 不 同 的 因子 上 。 


求 因子 轴 相 互 垂直 ,旋转 后 的 各 因子 轴 可 以 停留 在 因子 
空间 的 任意 位 置 ,从 而 使 每 条 因子 轴 更 擎 近 各 自 的 变量 
群 ,如 图 10 -4 所 示 。 并 且 , 斜 交 因 子 轴 之 间 的 夹 角 余 
弦 值 就 是 两 因子 间 的 相关 系数 。 

斜 交 旋转 的 基本 思想 是 :在 初始 的 因子 载荷 矩阵 A 
的 基础 上 , 先 求 得 正 交 旋转 后 的 因子 载荷 矩阵 B; 然 后 
对 因子 载荷 憩 阵 B 进行 斜 交 旋转 ,从 而 获得 斜 交 旋 转 
下 的 因子 载荷 矩阵 。 斜 交 旋 转 的 方法 有 Promax 斜 交 
旋转 法 .直接 斜 交 极 小 法 (Direct Oblimin) .广义 斜 交 极 
小 法 、 四 方 最 小 法 等 。 但 是 斜 交 旋 转 的 方法 本 身 存在 争议 ,SPSS 系统 也 只 是 提供 了 两 种 
斜 交 旋转 的 方法 , 即 Promax 斜 交 旋 转 法 和 直接 斜 交 极 小 法 。 

Promax 斜 交 旋 转 法 是 目前 使 用 最 为 广泛 的 一 种 斜 交 旋 转 方法 。 它 强调 在 因子 结 
构 外 部 寻找 旋转 准则 ,其 基本 思想 是 :在 获得 了 大 量 的 关于 变量 和 多 次 因素 分 析 的 资 
料 后 ,得 出 一 个 假设 矩阵 ,然后 通过 旋转 使 实际 的 因子 结构 和 假设 矩阵 达到 最 大 程度 
的 拟 合 。 

Promax 斜 交 旋转 的 基本 过 程 是 :首先 选 定 一 个 初始 正 交 因 子 解 A; 然 后 对 初始 正 交 
因子 载荷 都 加 以 2 次 方 或 四 次 方 ,但 符号 保持 不 变 , 以 此 来 加 大 因子 载荷 间 的 离散 程度 ， 
从 而 得 到 假设 矩阵 妃 ; 接 下 来 从 假设 因子 导出 斜 参照 因子 变换 矩阵 ,并 以 此 求 出 斜 交 主 
因子 变换 矩阵 了 ;最 后 将 初始 正 交 因子 变换 为 斜 交 因 子 。 

虽然 斜 交 旋 转 可 以 解决 各 因子 间 的 相关 问题 ,但 是 它 却 难以 解释 各 变量 被 公共 因子 
所 解释 的 比例 。 因 为 在 斜 交 旋 转 所 得 到 的 因子 载荷 矩阵 中 ,每 行 的 因子 载荷 平方 和 只 有 
在 偶然 的 情况 下 才 等 于 共同 度 下 ;同样 ,每 列 的 载荷 平方 和 也 只 在 偶然 情况 下 才 等 于 总 
方差 。 所 以 ,通过 斜 交 旋 转 得 到 的 结果 目前 还 存在 和 争议。 在 研究 过 程 中 ,使 用 怎样 的 旋 
转 方 法 还 需要 根据 具体 情况 来 定 ， 

另外 ,在 进行 斜 交 旋转 后 .我 们 得 到 的 因子 之 间 具 有 一 定 相关 ,因此 ,这 些 公 共 因 
子 就 可 以 形成 一 个 公共 因子 的 相关 和 矩阵。 用 因素 分 析 的 一 般 方法 对 这 些 因 子 进行 分 
析 .就 可 以 得 到 “高 阶 因 子 ”。 也 就 是 说 , 斜 交 旋转 后 的 因子 可 以 进一步 作为 因素 分 析 
的 变量 。 





图 10-4 因子 的 斜 交 旋转 示意 图 


第 五 节 因子 得 分 与 因子 命名 


通过 前 几 节 介绍 的 方法 ,我 们 可 以 确定 一 些 复杂 变量 的 因子 结构 。 倘 车 研究 只 是 为 


了 了 解 各 变量 间 的 关系 ,确定 公共 因子 的 性 质 , 那 么 目的 已 经 达到 了 。 但 是 ,如 果 要 将 个 
人 的 测验 结果 进行 分 类 ,或 者 要 进行 其 他 更 加 深入 的 研究 ,就 需 计 算 因 子 得 分 ， 因 为 个 
体 在 某 个 因子 上 的 得 分 ,反映 了 个 体 在 这 个 因子 上 的 能 力 水 平 。 也 就 是 说 ,如 果 想 比较 
某 一 个 体 或 某 一 群体 在 某 种 因子 上 的 水 平 差 异 ,可 以 对 其 因子 得 分 进行 比较 ,而 不 需要 
比较 其 所 有 的 原 变量 得 分 。 当 然 , 这 些 因子 所 代表 的 意义 ,最 好 通过 因子 命名 的 方式 确 
定 下 来 。 


因素 分 析 的 基本 模型 是 X=A，F-+e, 包 含 公共 因子 的 部 分 4A。F 和 误差 部 分 。 对 
误差 部 分 的 影响 进行 充分 控制 后 ,可 以 忽略 误差 部 分 ,就 有 X 一 A。 下 。 因 此 ,可 将 因素 
分 析 的 基本 公式 视 为 一 个 多 元 回归 方程 ,因子 分 相当 于 其 中 的 回归 系数 ， 

因子 分 的 计算 方法 有 很 多 种 ,通常 采用 多 元 线性 回归 的 方法 。 考 虑 到 公共 因子 与 
所 有 变量 的 关系 ,可 以 将 因子 分 估计 为 : 启 二 wn XX 十 zwjz XX 十 十 wp 六, (fj 三 1,2,…*， 
ia) ,其 中 WW; GG 二 1.2、…、.p) 为 标准 化 后 的 数据 和 矩 阵 X 的 加 权 系 数 , 反 映 了 第 i 个 变量 与 
第 j 个 因子 的 相关 关系 。 然 后 可 以 根据 最 小 二 乘法 对 因子 分 进行 估计 。 首 先 ,将 误差 定 
义 为 因子 模型 中 真 因子 分 与 因子 分 估计 值 产 之 间 的 差异 ,所 以 有 误差 矩阵 正 一 下 一 
然后 使 误差 平方 和 达到 最 小 ,从 而 得 出 因子 分 的 估计 值 。 

此 外 ,还 有 两 种 常用 的 因子 分 的 估计 方法 : Bartlett 法 和 Anderson-Rubin 法 。 
它们 也 是 基于 最 小 二 乘 原 子 分 进行 估计 的 。 它们 和 回归 法 的 区 别 在 于 对 误差 的 
定义 不 同 。Bartlett 法 将 误差 定义 为 R 素 得 分 的 估计 值 ,通过 使 特殊 因素 的 得 分 达 
到 最 小 来 估计 因子 分 。Anderson-Rubin 法 也 是 通过 使 误差 的 估计 值 达到 最 小 来 对 因子 
分 进行 估计 ,但 是 它 还 增加 了 因子 分 估计 值 之 间 的 相互 正 交 条 件 。 


二 、 因 子 的 命名 


因素 分 析 的 目的 是 建立 合适 的 拟 合 模型 , 即 用 较 少 的 几 个 因子 解释 大 量 的 数据 变 
化 。 经 过 了 因子 提取 、 因 子 数 确定 .因子 旋转 等 几 个 步骤 之 后 ,我 们 就 能 够 确定 繁杂 数据 
之 间 的 内 在 关系 ,获得 相对 简单 的 因子 模型 。 

但 是 ,通过 统计 学 的 方法 所 获得 的 结果 仅仅 具有 数学 上 的 意义 。 作 为 心理 学 研究 
者 ,我 们 更 关心 数据 间 所 隐 含 的 心理 学 意义 。 所 以 ,在 对 提取 的 因子 模型 进行 解释 的 过 
程 中 ,我 们 不 应 局 限于 统计 学 知识 ,而 应 结合 心理 学 的 专业 知识 以 及 相关 经 验 , 对 数据 做 
出 心理 学 层面 的 解释 。 因 此 ,因子 的 命名 和 解释 带 有 很 强 的 专业 性 ,也 会 带 有 主观 性 ,能 
够 体现 出 研究 者 的 专业 素养 和 个 人 倾向 。 
dap ep de 需要 注意 ,通过 因素 分 析 所 得 到 的 结果 只 

:关系 ,而 不 是 因果 关系 。 提 取 的 公共 因子 仅 能 反映 某 些 
变动 的 相互 联系 性 ,而 不 能 说 明 这 种 联系 方向 性 。 所 以 ， cd 
们 所 提取 的 因子 导致 了 变量 的 变化 。 如 果 要 证 明 变 量 间 变 
步 研 究 。 
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第 六 节 ”因素 分 析 的 SPSS 过 程 


在 因素 分 析 的 过 程 中 ,需要 将 原始 数据 转化 为 标准 分 数 , 然 后 根据 标准 分 数 求 得 变 
量 间 的 相关 矩阵 ,并 进行 下 一 步 分 析 。 但 是 ,在 SPSS 软件 中 ,可 以 直接 用 原始 数据 做 因 
素 分 析 ,而 不 需要 将 它们 转化 为 标准 分 数 。 原 始 分 数 和 经 过 标准 化 处 理 的 数据 分 析 结 果 
是 一 样 的 。 


一 、 因 素 分 析 的 操作 步骤 


下 面 结合 具体 示例 来 介绍 使 用 SPSS 进行 因素 分 析 的 操作 过 程 。 
【 例 10-1】 表 10-3 是 一 项 关于 大 学 生 心理 压力 源 的 调查 ,其 中 包括 25 名 学 生 在 
10 个 测验 上 的 得 分 。 试 采用 因素 分 析 的 方法 探索 10 个 测验 之 间 的 结构 。 
表 10 -3 大 学 生 心 理 压力 调查 数据 





【 解 】 借助 于 SPSS 系统 完成 这 一 因素 分 析 ,其 操作 大 致 可 以 分 为 以 下 几 个 部 分 : 数 
据 文件 的 建立 ,因素 分 析 适 合 度 检验 ,因子 提取 ,获得 因子 载荷 短 阵 和 进行 因子 旋转 、 因 
子 命名 和 因子 分 的 计算 等 。 下 边 分 步 了 予以 介绍 ， 

步骤 1: 数 据 文件 的 建立 

表 10 -3 中 的 数据 来 自 于 25 名 被 试 ,包含 10 项 测验 得 分 ,所 以 建立 的 SPSS 数据 文 
件 有 25 个 个 案 行 .10 个 变量 列 ,如 图 10 -5 所 示 。 
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图 10-~-5 因子 分 析 的 数据 文件 受 菜单 示意 图 
步骤 2: 打 开 主 对 话 框 ,选择 相应 的 变量 列表 
单 击 菜单 “Analyze" 选 择 “Data Reducetion* 中 的 “Factor” ,打开 对 话 框 ,如 图 10-6 所 
示 。 从 对 话 框 左 侧 窗 口中 的 变量 列表 中 选择 参与 因素 分 析 的 所 有 原 变量 ,点 击 ” 国 加 ”将 
这 些 变量 置信 右 侧 “Variables” 之 下 的 方 框 中 。 


Variables: 


| Selection Variable: 


I 
Descriptives…| Extraction... | Rotation... | Scores... | OQptions... | 





图 10-=6 因素 分 析 的 主 对 话 戏 
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步 3: 描述 性 统计 量 的 输出 设置 

单 击 主 对 话 框 上 的 "Descriptives… "按钮 ,打开 如 图 10 -7 所 示 的 对 话 框 。 此 对 话 框 
可 以 设置 输出 结果 的 按钮 是 : 勾 选 “Univari 
ate descriptives” 可 以 输出 各 个 原 变 量 的 平 
均 数 和 标准 差 ; 勾 选 *Initial solution” 可 以 输 
出 基本 的 因素 分 析 结 果 , 按 照 默 认 的 提取 因 
子 数 的 决定 方案 (提取 的 因子 的 特征 值 大 于 
1) 确 定 因子 数 , 然 后 输出 公共 因子 的 解释 方 
差 累 积 表 , 变 量 的 共同 度 和 因子 载荷 矩阵 等 
结果 : 勾 选 "Coefficients” 输 出 原 变 量 的 相关 
算 阵 ; 勾 选 “Anti-image” 输 出 原 变 量 的 反 像 
相关 和 矩阵 ; 勾 选 “KMO and Bartlett’s test of 
sphericity" 输 出 因素 分 析 适 合 度 检验 的 参 
数 。 本 例 勾 选 如 图 10 -7 所 示 。 单 击 “Con- 


KMO and Bartiet's test of sphericity 





图 10-~7 Factor Analysis，Descriptives 对 话 框 


tinue" 按 钮 返回 主 对 话 框 。 

步骤 4: 因子 提取 方法 及 要 求 的 设置 

单 击 主 对 话 框 上 的 "Extraction…” 按 钮 ,打开 如 图 10 -8 所 示 的 对 话 框 ,可 以 进行 的 
选择 和 设置 主要 有 :在 “Method" 的 下 拉 菜 单 中 选择 因子 提取 方法 ,一 般 默认 的 是 主 成 份 
法 (Principal components) ; 勾 选 "Unrotated factor solution” 可 以 输出 未 经 旋转 的 因子 截 
荷 矩 阵 ; 勾 选 *Seree plot" 可 以 输出 碎 石 图 ; 勾 选 “Eigenvalues over” 可 以 设置 筛选 公共 因 
子 的 特征 值 标准 ,SPSS 系统 中 默认 的 特征 值 标准 是 大 于 1; 勾 选 <Number of factors” 可 
以 在 其 后 输入 要 提取 的 因子 数 。 在 实际 的 因子 分 析 操 作 中 ,研究 者 起 初 不 能 确定 提取 多 
少 个 因子 比较 合适 ,第 一 轮 操作 中 不 对 此 项 进行 设置 ,而 是 让 系统 按照 默认 的 标准 提取 
因子 ,然后 根据 对 第 一 轮 输出 结果 的 综合 分 析 ,确定 是 否 尝试 改变 提取 的 因子 数 。 这 一 
过 程 可 以 重复 若干 次 ,直至 得 到 满意 的 因子 结构 为 止 。 本 例 的 初始 默认 设置 如 图 10 -8 
所 示 。 单 击 *Continue” 按 钮 返回 主 对 话 框 ，。 

步骤 5: 因子 旋转 的 设置 

单 击 主 对 话 框 上 的 "Rotation… ”按钮 ,打开 如 图 10 -9 所 示 的 对 话 框 ,利用 此 对 话 杠 





图 10-8 Factor Analysis，Extraction 对 话 框 


ji 


226 


可 以 设置 是 否 作 因 子 旋转 :以 及 如 何 进行 因子 旋转 。 有 具体 操作 方法 是 :在 对 话 框 的 
“Method" 栏 中 可 以 选择 因子 旋转 的 方法 ,SPSS 系统 的 默认 状态 是 "None”, 即 不 进行 因 
子 旋转 ;常用 的 匀 选 是 正 交 旋转 (Varimax, 即 方差 极 大 化 ) 、 斜 交 旋 转 (Promax)。 本 例 选 
择 正 交 旋 转 方法 ,同时 勾 选 <Rotated solution "以 输出 旋转 后 的 因 子 裁 荷 矩 阵 . 如 图 10-9 
所 示 。 单 击 "Continue” 按 钮 返回 主 对 话 框 。 
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团 10-9 Facior Analysis: Rotation 对 话 框 

步骤 6: 设 置 计 算 因 子 分 

单 击 主 对 话 框 上 的 “Scores…” 按 钮 ,打开 如 图 10 - 10 所 示 的 对 话 框 ,可 以 设置 因子 
分 的 计算 方法 和 因子 分 的 相关 和 矩阵 。 本 例 的 操作 是 : 色 选 “Save as variables” 激 活 对 话 框 
选项 ,然后 系统 默认 的 因子 分 计算 方法 是 回归 法 (Regression) ,一 般 也 都 是 使 用 这 种 方 
法 ;同时 , 勾 选 “Display factor score coeffcient matrix” 可 以 输出 因子 得 分 的 系数 矩阵 , 实 
际 上 就 是 计算 因子 分 的 回归 方程 中 的 回归 系数 。 做 这 些 设置 后 ,系统 会 计算 每 个 被 试 的 
各 项 因子 分 ,并 将 其 作为 生成 的 新 变量 加 载 到 数据 文件 上 去 。 单 击 *“Continue 按钮 返回 
主 对 话 框 。 





图 10-~-10 Factor Analysis- Factor Scores 对 话 框 
步 桑 7: 设置 因子 载荷 矩阵 输出 格式 
单 击 主 对 话 框 上 的 "Options…” 按 钮 ,打开 如 图 10 - 11 所 示 的 对 话 框 。 在 该 对 话 框 
上 设置 因子 载荷 矩阵 的 排列 : 勾 选 “Sorted by size"”, 尽 量 使 载荷 按 由 大 到 小 的 顺序 自 上 
而 下 的 排列 ; 勾 选 “Suppress absolute values less than ”可 以 设置 载荷 的 显示 下 限 , 即 要 求 
系统 不 要 显示 低 于 某 一 值 的 载荷 。 本 例 中 设置 的 显示 下 限 是 0. 50, 如 图 10 - 11 所 示 。 
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单 击 “Continue" 按 钮 返回 主 对 话 框 。 
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图 10~11 因子 载荷 矩阵 输出 格式 设置 对 活 框 
完成 上 述 设置 之 后 , 单 击 主 对 话 框 上 的 OK" 按钮 , 即 可 输出 所 需要 的 结果 。 
二 、 因 素 分 析 结 果 的 读 取 与 解释 


(一 ) 因素 分 析 的 适合 度 检验 
如 表 10 -4 所 示 , 因 素 分 析 适 合 度 的 检验 结果 中 :KMO=0.730、Bartlett 球形 检验 达 


到 极其 显著 性 的 水 平 ,说 明 原 变量 之 间 具 有 了 明显 的 结构 性 和 相关 关系 。 根 据 Kaiser 给 出 
的 KMO 度量 标准 ,这 些 变量 可 以 进行 因素 分 析 。 


二 注 计 总 


息 。 


表 10-4 因素 分 析 适 合 度 检验 结果 {KMO and Bartletts Test) 


Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .730 











Bartlett's Test of Sphericity Approx，Chi-Square 204. 407 
df 45 
Sig. , 000 





(二 ) 变量 的 共同 度 
表 10 -5 所 示 是 输出 的 变量 共同 度 , 表 中 第 一 列 是 原 变 量 名 ;第 二 列 是 根据 初始 解 计 


算出 的 变量 共同 度 , 均 为 1, 实际 上 是 将 10 个 主 成 份 均 作 为 公共 因子 时 计算 的 共同 度 ; 第 
三 列 是 系统 确认 只 提取 三 个 公共 因子 后 计算 的 变量 共同 度 。 例 如 , 表 中 第 一 个 变量 XIl 
的 共同 度 为 0.957, 表 明 提取 的 所 有 因子 共同 解释 了 变量 Xl 所 产生 的 95. 7% 的 变异 信 


这 一 输出 结果 中 , 除 一 项 外 ,其 他 变量 的 共同 度 均 大 于 0. 80, 是 比较 理想 的 状态 。 
表 10-5 变量 的 共同 度 (Communalities) 









Variables Initial Extraction Variables Initial Extraction 





Xl 1. 000 357 X6 1. 000 . 805 

X2 1. 000 .867 X7 1.000 -904 

X3 1.000 ,844 X8 1.000 .901 

X4 1.000 .843 | X9 1, 000 . 788 
5 000 | 1 
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(三 ) 主 成 份 .公共 因子 的 特征 值 和 方差 贡献 
表 10-6 所 示 的 数据 包括 三 个 部 分 :第 一 部 分 是 初始 的 解 , 即 尚未 进行 因子 提取 时 ， 


主 成 份 的 特征 值 .方差 贡献 率 和 累积 的 方差 贡献 率 , 它 是 按照 从 大 到 小 的 顺序 来 排列 的 ; 
第 二 部 分 是 提取 三 个 公共 因子 后 的 方差 贡献 率 和 累积 的 方差 贡献 率 , 确 定 提 取 的 三 个 因 
子 依据 是 默认 的 提取 标准 , 即 特征 值 大 于 1 的 主 成 份 可 提取 出 来 作为 公共 因子 ;第 三 部 
分 是 旋转 后 因子 的 特征 值 , 方 差 贡 献 率 和 累积 的 方差 贡献 率 。 

由 表 10 -6 我们 知道 ,第 一 个 因子 解 的 特征 值 为 4.363, 它 解释 了 所 有 10 个 变量 变 
异 信息 总 量 中 的 43. 63%% ,是 方差 贡献 最 大 的 一 个 主 成 份 ,所 以 是 第 一 主 成 份 ; 同 理 , 第 二 
个 因子 解 解释 了 所 有 变量 变异 信息 总 量 中 的 26. 607%, 第 三 个 因子 解释 了 16. 806%。 
从 第 四 个 因子 解 开始 ,特征 值 都 小 于 1( 第 四 个 为 0. 353 ,第 五 个 为 0. 208,…), 所 以 只 提 
取 了 前 三 个 因子 解 作为 公共 因子 。 并 且 , 前 三 个 因子 解 共 解 释 了 所 有 变量 变异 信息 总 量 
中 的 87. 044% ,达到 了 比较 好 的 水 平 。 由 此 看 来 ,该 例 提取 三 个 公共 因子 是 比较 恰当 的 。 

表 10-6 主 成 份 和 提取 的 因子 的 特征 值 与 方差 贡献 (Total Variance Explained) 







初始 解 特征 值 及 三 个 因子 的 旋转 后 因子 的 
方 莽 贡 献 方差 贡献 特征 与 方差 贡献 
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] 4.363 43.630 43. 630 43. 630 43. 630 41.079 41.079 
2 2. 661 26. 607 70. 237 26. 607 70. 237 2.700 26.997 68.076 
3 1.681 16. 806 87.044 16. 806 87. 044 1.897 18.967 87.044 
1 .353 3. 528 90, 571 

5 .347 3.474 94.046 

6 . 208 2.075 96. 121 

和 .154 1.540 97. 661 

8 | 9.934E -02 .993 98. 654 

9 | 7.853 马 -02 .785 99. 439 

10 | 5.607E -02 .561 100. 000 


主 成 分 特征 值 的 变化 也 可 以 以 碎 石 图 的 形式 输出 ,如 图 10 -12 就 是 本 例 输出 的 碎 石 
图 。 碎 石 图 显示 ,从 第 四 个 因子 解 开始 曲线 就 变 得 很 平缓 ,也 就 是 说 第 四 个 因子 解 以 后 
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图 10-12 主 成 份 特征 值 变 化 的 碎 石 图 
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的 各 主 成 份 的 方差 贡献 变 得 都 很 小 ,其 至 可 以 忽略 。 所 以 此 碎 石 图 可 以 很 直观 地 显示 : 
提取 三 个 公共 因子 是 合适 的 。 


(四 ) 未 经 旋转 的 因子 载荷 矩阵 

表 10 -7 所 了 未 的 是 未 经 旋转 的 因子 载荷 和 矩阵， 按照 对 话 框 操作 的 要 求 ,因子 载 荷 在 
该 矩阵 中 的 排列 是 按照 从 大 到 小 的 顺序 的 ,而 且 凡 是 小 于 0. 50 的 载荷 均 不 显示 出 来 。 
这 一 载荷 矩阵 还 是 比较 好 的 ,基本 上 可 以 看 出 公共 因子 与 原 变 量 之 间 的 对 应 关系 :有 五 
个 变量 在 第 一 个 因子 上 的 载荷 比较 高 ,分别 为 0.912.0.911.0.903 .0. 884、0.783; 有 三 个 
变量 在 第 二 个 因子 上 的 载荷 比较 高 ,分 别 为 0.809.0. 808 .0.737: 还 有 一 个 变量 在 第 二 个 
因子 上 的 载荷 为 中 等 水 平 ,是 0.588; 有 两 个 变量 在 第 三 个 因子 上 有 较 高 载荷 ,分 别 为 
0.860.0.741。 这 个 载荷 矩阵 也 同时 显示 ,有 一 个 变量 同时 在 两 个 因子 上 的 载荷 超过 了 
0. 50, 可 以 考虑 进行 因子 旋转 。 


表 10-7 未 经 旋转 的 因子 载荷 矩阵 表 10-8 旋转 后 的 因子 载荷 矩阵 


Component Component 








(五 ) 旋转 后 的 因子 载荷 矩阵 

采用 方差 极 大 化 方法 进行 因子 旋转 .旋转 后 得 到 的 因子 载荷 矩阵 如 表 10 -8 所 示 。 
旋转 后 ,载荷 大 小 进一步 分 化 ,变量 与 因子 的 对 应 关系 更 加 清晰 ,可 以 很 容易 地 标识 出 各 
个 因子 所 影响 的 主要 变量 。 第 一 个 因子 影响 的 主要 变 其 是 ;学 业 成 绩 、 工 作 与 就 业 、 家 
庭 ,经 济 状况 ,社会 环境 ,不 妨 命名 为 “任务 与 环境 压力 ”; 第 二 个 因子 影响 的 变量 主要 是 : 
身体 状况 ,年龄 压力 ,价值观 ,不 妨 命名 为 “身体 状况 与 自我 价值 体验 ”; 第 三 个 因子 影响 
的 变量 主要 是 :恋爱 .人 际 关系 ,不 妨 命名 为 "情感 与 人 际 关 系 "。 


(六 ) 因子 分 的 计算 

经 过 前 述 的 过 程 ,因子 就 可 以 确定 下 来 ,然后 系统 会 根据 设置 的 方法 计算 出 每 一 个 
被 试 的 所 有 因子 分 ,这 些 因 子 分 自动 记 入 数据 文件 ,它们 可 以 作为 进一步 统计 分 析 的 资 
料 ,也 可 以 作为 评估 被 试 间 差 异 的 依据 。 就 本 例 来 说 .抽取 得 到 三 个 因子 分 ,采用 回归 方 
法 计算 得 到 的 因子 分 如 图 10- 13 所 示 。 
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图 10-13 系统 自动 记 入 数据 文件 的 因子 分 (标准 分 } 示 意图 
因子 分 计算 系数 矩阵 如 表 10 -9 所 示 。 


用 回归 方程 的 形式 表达 就 是 ， 
区 一 0.038X 十 0.034X， 十 十 0.220Xn 











99 二 条 园 荐 十 六 


< 下 ,一 0.376X 十 0.360X， 十 十 0.013Xnm 
已 ,一 0.056X 十 0.085X， 十 十 0.014XN 
表 10-9 因子 分 计算 系数 和 矩阵 {Component Score Coefficient Matrix) 
(Component 
Variables 
1 二 

Xl .038 .376 一 .056 
X2 .034 , S60 .085 
X3 vais .034 = 
X4 . 229 3 一 .027 
X5 .043 edt 530 
X6 .234 Sb . 025 
X7 .016 .D02 ,493 
X8 .224 .017 ,055 
X9 .031 ,321 a05] 
X10 .220 .013 , D114 
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验 .KMO 
. 试 述 因 素 分 析 的 基本 原理 。 
. 因素 分 析 的 基本 条 件 有 哪些 ? 如 何 进行 因素 分 析 的 适合 度 检验 ? 
. 如 何 提取 公共 因子 和 确定 因子 数 ? 
. 因子 旋转 的 作用 及 其 主要 的 方法 有 哪些 ? 
. 说 明 因 子 分 的 计算 方法 及 其 意义 。 
. 表 10 - 10 为 某 中 学 15 名 学 生 一 次 期 中 考试 的 8 门 功课 成 绩 。 试 借助 于 SPSS 系 
统 进行 因素 分 析 , 并 说 明 这 些 科 目 所 反映 的 学 生 的 能 力 结构 。 
表 10-10 学 生 样 本 的 功课 成 绩 


编号 ”代数 zl 几何 z2 物理 z3 地 理 z4 英语 z5 语文 z6 化 学 z7 历史 x8 


下 















1 94 83 78 80 70 50 65 80 
2 73 75 80 65 70 60 52 75 
3 ~ | 65 40 80 40 55 70 
4 50 45 68 60 80 60 65 80 
5 68 85 75 40 60 72 63 75 
6 67 67 72 62 65 62 62 75 
7 55 56 70 80 80 60 75 80 
这 8 70 84 65 60 60 62 55 73 
统 9 88 82 78 68 65 80 50 82 
学 10 40 60 75 62 70 75 60 70 
和 11 75 65 85 60 80 82 72 82 
Pp 12 88 86 90 85 82 82 90 80 
站 13 72 86 70 70 75 90 70 85 
应 14 65 60 60 50 65 62 60 
15 96 86 75 70 82 65 88 82 
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第 十 一 章 “比率 的 差异 性 检验 
Geass 


在 分 析 了 比率 的 抽样 分 布 之 后 ,利用 二 项 分 布 的 原理 把 总 体 比 率 的 区 间 估 计 , 以 及 
比率 的 显著 性 检验 纳入 到 标准 正 态 分 布 的 系统 中 , 即 利用 标准 正 态 Z 分 布 对 样本 比率 的 
显著 性 、 独 立 样本 间 比 率 的 差异 显著 性 、 相 关 样 本 间 比 率 的 差异 显著 性 进行 检验 。 本 章 
较为 详细 地 介绍 了 三 类 关于 比率 显著 性 检验 的 SPSS 过 程 ,及 其 输出 结果 的 读 取 和 解释 。 


此 前 讨论 的 各 种 统计 分 析 方 法 ,基本 上 都 是 针对 测量 数据 来 说 的 ,而 且 大 都 要 求 数 
据 是 连续 变化 的 。 但 是 ,在 实际 研究 中 ,特别 是 社会 科学 领域 ,常常 出 现 一 些 计 数 资料 ， 
即 在 对 有 性 质 差异 的 研究 对 象 进行 分 组 之 后 ,或 者 是 对 不 同 被 试 群体 的 某 种 行为 次 数 进 
行 统计 之 后 ,都 会 出 现 计 数 资料 。 基 于 计数 资料 比较 不 同 总 体 差 异 的 时 候 , 前 述 的 许多 
差异 检验 方法 都 不 能 使 用 (Z 检验 方法 除外 , 它 可 被 用 于 比率 检验 )。 


第 一 节 总体 比率 的 估计 


在 心理 和 教育 研究 中 ,经 常会 出 现 一 些 百分数 或 比率 ,并 用 它们 来 表示 实验 或 调查 
结果 。 但 是 这 些 百 分 数 或 比率 一 般 是 来 自 于 总 体 的 一 个 或 多 个 样本 ,那么 如 何 从 样本 比 
率 来 估计 总 体 比率 呢 ? 


一 、 样 本 比率 的 抽样 分 布 


通常 ,用 小 写 的 请 表示 样本 比率 ,大 写 的 P 表示 总 体 比率 ,而 比率 的 出 现 往往 意味 着 
对 象 被 划分 为 性 质 不 同 的 两 类 ,可 分 别 被 称 为 A 与 非 A( 可 表示 为 A), 所 以 随机 抽样 的 
样本 比率 分 布 符合 二 项 分 布 。 

假如 在 被 研究 的 总 体 中 ,具有 某 种 属性 的 个 体 或 事件 ( 即 二 项 试验 中 的 成 功 事件 ) 出 
现 的 概率 设 为 P, 则 不 具有 这 种 属性 的 个 体 或 事件 ( 即 失 败 事件 ) 出 现 的 概率 即 为 Q 二 1 一 
P, 从 这 样 的 总 体 中 随机 抽取 一 个 容量 为 的 样本 ,可 计算 其 成 功 事件 出 现 的 比率 为 p 二 


关 (X 为 成 功 事件 出 现 的 次 数 ), 失 败 事件 的 比率 即 为 a 一 1 一 p。 采 用 返回 式 的 重复 抽样 


就 可 以 从 总 体 中 得 到 容量 为 n 的 所 有 可 能 的 样本 ,也 由 此 形成 了 一 个 比率 p 的 抽样 分 
布 。 当 np 宇 5 和 ng 三 5 条 件 成 立时 ,二 项 分 布 接近 正 态 分 布 , 所 以 比率 的 抽样 分 布 也 近 
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似 于 正 态 分 布 ,对 样本 比率 进行 的 显著 性 检验 也 可 以 采用 Z 分 布 。 

就 二 项 分 布 来 说 ,反映 的 是 随机 样本 中 成 功 次 数 的 分 布 。 其 中 成 功 次 数 的 平均 数 
mA 一 1， 了 ,标准 差 c= VnPQ; 就 比率 的 抽样 分 布 来 说 ,反映 的 是 随机 样本 中 成 功 比 率 的 分 
布 ,而 比率 等 于 次 数 除 以 容量 wn。 所 以 ,比率 分 布 的 平均 数 与 标准 差 均 由 二 项 分 布 中 的 平 
均 数 ,标准 差 除 以 n 得到: 


比率 分 布 的 总 体 平均 数 :yw 一 =P (公式 11 -1) 
比率 分 布 的 总 体 标准 差 :一 2ZQ = /5 (公式 11-2) 


而 这 里 作为 比率 分 布 的 标准 基 的 cr * 也 就 是 其 分 布 的 标准 误 SE, (是 统计 量 p 的 标 
准 差 ) 。 


当 总 体 比率 未 知 时 ,可 用 样本 比率 p 一 作为 总 体 比率 的 点 估计 值 ,那么 总 体 比 
率 的 标准 误 的 估计 值 就 为 ， 


$=/ (公式 11-3) 


二 、 总 体 比率 的 区 间 估 计 


根据 所 抽取 样本 的 比率 ,估计 总 体 比 率 的 吐 信 区 间 , 称 为 总 体 比 率 的 区 间 估 计 。 对 
于 总 体 比 率 的 区 间 估 计 , 从 理论 上 讲 , 可 以 按 二 项 展开 式 来 求 , 但 是 计算 繁琐 。 为 了 简化 
计算 过 程 , 可 以 利用 下 面 的 简单 方法 。 

当 ?jp 三 5 和 wg 三 5 条 件 成 立时 ,二 项 分 布 曲线 与 正 态 分 布 曲线 已 经 相当 接近 , 即 比 
率 的 抽样 分 布 近似 于 正 态 分 布 。 此 时 .二 项 分 布 的 概率 可 以 用 正 态 分 布 的 概率 作为 近似 
值 ,此 条 件 下 Z 值 可 以 表示 为 : 

Z=- 拓 上 = (公式 11-4) 
Ve 
于 是 ,可 得 出 总 体 比 率 忆 分 布 中 的 置信 区 间 的 Z 分 数 区 间 为 : 
Pl(—Za<Z< 2 


~Zn< 


加 
P[p—z. fiepe p+Z, ‘9)=1—e 


于 是 ,总 体 比 率 在 (1 一 a) % 置 信 水 平 上 的 置信 区 间 可 写作 : 


p—Zuaf <P<pt+Zna fH (公式 11-5) 


例如 ,置信 度 为 95% 时 , 则 总 体 比率 了 的 置信 区 间 为 : 


p 一 1.96 /<Pp<pt1.96 \/ 如 CR 11 6) 


一 1 一 上 


将 公式 11 -4 代 人 上 式 , 可 以 得 到 P 








置信 度 为 99% 时 , 则 总 体 比 率 P 的 置信 区 间 为 : 


p—2.58 ba p<pt2.58 ,9 (公式 11 -7) 


nn 
【 例 11-1】 随机 抽取 某 区 的 400 名 初 三 学 生 , 调 查 其 视力 情况 ,发现 其 中 180 名 学 
生 患 有 不 同 程度 的 近视 , 试 估计 该 地 区 初 三 学 生 患 近视 的 真实 比率 大 概 在 什么 范围 ? 
【 解 】 这 一 问题 ,是 从 样本 比率 来 估计 总 体 比率 的 置信 区 间 。 我 们 可 以 将 置信 和 度 分 
别 定 为 95 站 和 99% 两 个 水 平 ,然后 计算 总 体 比率 的 置信 区 间 。 


已 知 样本 近视 者 比率 p 一 99 一 0.45, 未 近视 者 比率 9 一 1 一 0. 45 一 0. 55， 

所 以 ,比率 分 布 的 标准 误 为 :SE, 一 0, = 29 = ~0. 025 

因为 up=180 二 5 mg 一 220 二 5 比率 的 抽样 分 布 近似 于 正 态 , 可 以 使 用 公式 11 -5 计 
算 置信 区 间 ， 

当 置 信和 度 为 95 中 时 ,总 体 比率 的 置信 区 间 为 : 

0. 45 一 1.96X0.025 一 P 一 0. 45 十 1.96X0.025, 即 0.401 一 也 一 0. 499， 

当 置信 度 为 99% 时 ,总 体 比率 的 置信 区 间 为 : 

0. 45 一 2.58X0. 025 一 P 一 0. 45 十 2. 58X0.025 , 即 0.386 一 已 一 0. 515 。 


第 二 节 单 样本 比率 的 差异 检验 


单 样本 比率 的 显著 性 检验 ,就 是 看 比率 为 p 的 样本 是 不 是 比率 为 P 的 已 知 总 体 的 一 
个 随机 样本 。 如 果实 际 观察 样本 比率 p 落 在 总 体 比率 呈 的 样本 分 布 的 置信 区 间 之 外 , 则 
可 以 推断 ,样本 和 总 体 之 间 存 在 显著 性 差异 ,它们 之 间 的 差异 不 能 仅 用 抽样 的 随机 误差 
解释 。 如 果实 际 观察 样本 比率 p 落 在 总 体 比 率 P 的 样本 分 布 的 置信 区 间 之 内 , 则 可 以 推 
断 样本 是 已 知 总 体 的 一 个 随机 样本 ,观察 样本 比率 和 总 体 比 率 之 间 的 差异 是 由 抽样 的 随 
机 误差 引起 的 。 


一 、 检 验 假设 与 虚无 假设 


单 样本 比率 的 显著 性 检验 ( 双 侧 检验 ) ,首先 提出 研究 假设 和 虚无 假设 : 

虚无 假设 H,;p 二 P, 即 观察 样本 比率 和 已 知 总 体 比率 也 之 间 无 显著 性 差异 ,实际 
观察 的 样本 是 已 知 总 体 的 一 个 随机 样本 ,它们 之 间 的 差异 是 由 随机 抽样 误差 引起 的 。 

研究 假设 Hi :p 取 P, 观 察 样本 比率 p 和 已 知 总 体 比 率 呈 之 间 存 在 显著 性 差异 ,观察 
样本 所 属 的 总 体 和 已 知 总 体 并 不 是 同一 个 总 体 , 也 就 是 观察 样本 不 是 已 知 总 体 的 随机 样 
本 ,样本 比率 p 和 总 体 比率 P 之 间 的 差异 并 不 仅仅 是 由 抽样 误差 引起 的 。 


二 、 检 验 统计 量 的 计算 


在 第 二 章 已 经 讲 过 , 当 np 三 5 和 ng 三 5 条 件 成 立时 ,二 项 分 布 接近 正 态 分 布 , 此 时 可 
以 用 正 态 分布 来 计算 检验 统计 量 。 


e098@OF 谍 订 可 及 愉 英 开 时 | 十 注 





我 们 已 经 提出 虚无 假设 p= P, 也 就 是 假设 实际 观察 样本 是 已 知 总 体 的 一 个 随机 样 
本 ,因此 已 知 总 体 的 比率 分 布 的 标准 误 为 :o, = /2 . 


n 
检验 统计 量 的 计算 公式 是 :2Z= i (公式 11 -8) 
本 
三 、 统 计 决 策 


如 果 12| 三 Zus ,接受 虚无 假设 ,表明 实际 观察 的 样本 比率 户 落 在 已 知 总 体 的 样本 分 
布置 信 区 间 内 ,实际 观察 样本 与 已 知 总 体 之 间 没 有 显著 性 差异 。 

如 果 121 二 Z。s ,拒绝 虚无 假设 ,表明 实际 观察 样本 比率 p 落 在 已 知 总 体 的 样本 分 布 
置信 区 间 之 外 ,实际 观察 样本 和 已 知 总 体 之 间 存 在 显著 性 差异 。 

【 例 11 - 2】 某 大 学 一 年 级 公共 英语 考试 的 不 及 格 率 为 3% ,其 中 某 学 院 的 120 名 
大 一 学 生 中 有 6 人 不 及 格 , 问 该 学 院 公 共 英 语 考 试 成 绩 的 不 及 格 率 和 全 校 的 不 及 格 率 是 
否 有 显著 性 差异 ? 


【 解 】〗 根据 题 意 ,已 知 P=0.03 ,Q==0.97， p= =0. 05 ,n=120.。 


120 
虚无 假设 H,:p=P 
研究 假设 H,:p 取 P 
因为 np 三 5 且 ng 三 5, 所 以 使 用 公式 11 -8 计算 检验 统计 量 : 
| 0. 0.05—0.03 0.03 
0.03X0.97 
因 |12Z| 一 2Z.。oz ,在 0.05 和 
成 绩 不 及 格 率 与 全 校 学 生 的 不 及 格 率 无 显著 性 差异 。 


一 1. 285 ,而 Zi.051z 三 1, 96 


第 三 节 相关 样本 比率 的 差异 检验 


两 个 样本 相关 , 即 同 一 组 被 试 参加 前 后 两 次 实验 (两 次 实验 的 项 目 完 全 相同 ) ,或 调 
查 同一 组 被 试 在 实验 前 后 的 情况 ,那么 就 可 以 得 到 两 组 一 一 对 应 的 数据 (两 次 实验 的 数 
据 或 实验 前 后 的 两 组 数据 )。 根 据 这 两 组 数据 分 别 计算 出 来 的 比率 ,就 是 相关 样本 比率 。 


一 、2X2 资料 登记 四 格 表 珊 和 
| 


一 0 人 河 局 山 册 由 盯 非 卫 莹 峭 上 


在 心理 教育 研究 中 ,有 的 测量 结果 只 有 两 种 类 别 , 如 男性 和 女性 ;也 有 因为 研究 需要 
而 将 本 来 属于 测量 得 到 的 正 态 连续 变量 的 数据 , 按 一 定 的 标准 分 为 不 同类 别 , 如 将 学 生 
的 成 绩 分 为 及 格 和 不 及 格 。 分 别 计算 每 一 类 别 的 累计 频数 ,并 将 它们 登记 到 四 格 表 中 ， 
如 表 11 -1 所 示 。 

【 例 11-3】 随机 抽取 120 名 学 生 代 表 , 在 听取 某 种 奖学金 制度 宣讲 前 后 两 次 征求 
他 们 对 该 新 制度 的 意见 ,每 一 位 学 生 有 前 后 两 次 调查 结果 ,统计 资料 如 表 11- 1。 


表 11-1 120 名 学 生前 后 两 次 调查 结果 












37(a) 51( 人 

区 对 | 16Cc) | 16(m 
2 

从 表 11 - 1 可知 :(a) 表 示 有 37 位 同学 在 听取 奖学金 制度 宣传 前 后 都 次 成 这 项 新 制 
度 。(b) 表 示 有 51 位 同学 在 听取 奖学金 制度 宣传 之 前 反对 这 项 新 制度 ,但 在 听 过 宣讲 之 
后 , 转 而 赞成 该 制度 。(c) 表 示 有 16 位 同学 在 听取 奖学金 制度 宣传 之 前 是 赞成 这 项 新 制 
度 的 ,但 在 听 过 宣传 之 后 转 而 反对 该 制度 。(d) 表 示 有 16 位 同学 在 听取 奖学金 制度 宣讲 
前 后 都 反对 这 项 制度 ， 

二 、 检 验 假设 与 虚无 假设 

相关 样本 比率 差异 显著 性 检验 ( 双 侧 检验 ) 的 统计 假设 为 : 

虚无 假设 H,:P = P, ,表示 两 个 样本 来 自 于 总 体 比率 相等 的 两 个 总 体 ,也 可 以 说 两 
个 样本 来 自 于 同一 个 总 体 ,两 样本 比率 的 差异 是 由 于 抽样 的 随机 误差 引起 的 ， 

研究 假设 H, :P1 关 P; ,表示 两 个 样本 的 总 体 比率 不 同 , 即 两 个 样本 分 别 来 自 于 两 个 
不 同 总 体 。 

就 上 例 来 说 ,虚无 假设 的 意思 是 :奖学金 制度 宣讲 前 后 ,学 生 对 这 种 新 制度 的 总 体 园 
成 和 反对 率 无 变化 ,也 就 是 宣传 前 后 学 生 的 态度 没有 改变 ,样本 中 出 现 的 差异 是 由 抽样 
误差 造成 的 。 研 究 假设 的 意思 是 :奖学金 制度 宣传 前 后 ,学 生 对 这 种 新 制度 的 总 体 赞成 
率 和 反对 率 确实 发 生 了 改变 。 

三 、 检 验 统计 量 Z 分 数 计算 

从 四 格 表 中 可 以 看 出 ,a 和 d 是 在 前 后 两 次 调查 中 态度 未 发 生 改变 的 人 数 ,所 以 a 和 
d 不 会 带 来 两 次 调查 中 的 反应 差异 ;4 和 * 是 前 后 两 次 调查 中 态度 发 生 了 改变 的 人 数 (6 
是 第 一 次 调查 持 反对 态度 ,第 二 次 赞成 的 人 数 :c 是 第 一 次 赞成 ,第 二 次 反对 的 人 数 ) ,所 
以 4 和 < 才 是 可 能 造成 两 次 调查 结果 差异 的 原因 ， 

两 次 调查 中 持 费 成 态度 的 比率 之 差 为 : 记 一 户 一 上 一 和 2 一 天 ,这样 ,前 后 两 次 


调查 的 比率 之 差 的 显著 性 检验 就 成 为 和 二 之 间 的 差异 是 否 显著 的 问题 ， 


我 们 可 以 另外 假设 一 个 二 项 分 布 总 体 , 即 态度 发 生 了 变化 的 总 体 , 从 中 随机 抽取 了 
一 个 容量 为 "一 6 十 c 的 样本 。 根 据 两 个 总 体 无 显著 性 差异 的 假设 , 则 已 一 P: 二 0, 即 6 二 


cb 和 ec 在 态度 发 生 了 改变 的 总 体 中 出 现 的 概率 分 别 为 二， 即 第 一 次 调查 持 反 对 意见 而 
第 二 次 赞成 (成 功 事件 ) 的 同学 在 态度 发 生变 化 的 总 体 中 出 现 的 概率 为 p 一 部: 而 第 一 次 
调查 持 先 成 意见 第 二 次 反对 (失败 事件 ) 的 同学 在 态度 发 生变 化 的 总 体 中 出 现 的 概率 为 
q=1 一 p 一 方 。 于 是 这 个 发 生 了 变化 的 二 项 分 布 的 总 体 的 平均 数 , 标 准 差 为 ; 


(TTT Er 





和 (公式 11 -9) 


= VEC= (bo)X 训 X 冯 一 池 于 (公式 11 -10) 
由 于 抽样 误差 的 存在 ,每 次 取样 b 和 < 不 可 能 完全 相等 ， Sm Ne 中 
是 两 相关 样本 比率 差异 的 显著 性 检验 ,就 成 了 检验 样本 比率 为 p= 与 P 一 方 的 总 体 之 


间 是 否 有 显著 性 差异 的 问题 。 
十 < 一 ?全 10, 即 np 三 5 时 ,可 以 用 正 态 分 布 概率 解释 ,其 检验 统计 量 为 : 











bp-P_ bte 2_ be A 
Z FG Tt 元 可 《公式 11 -11) 
n 一 
五 十 < 
四 、 统 计 决 策 
如 果 1Z1 二 Zz, 则 拒绝 虚无 假设 ,认为 4 或 c 落 在 { 工 十 土 } ”的 置信 区 间 之 外 ,两 相 
心 。 关 样本 比率 存在 显著 性 差异 ， 
生 。 车 临界 值 |Z| 二 Z.,, 则 接受 虚无 假设 ， 表明 或 。 基 在 (十 + 地 ) ”这 一 分 布 的 置信 
与 ”区 间 之 内 ,两 相关 样本 比率 不 存在 显著 性 差异 ,两 样本 之 间 的 差异 是 由 抽样 误差 引起 ， 
P  ， 例 11 -3 的 相关 样本 比率 差异 的 显著 性 检验 的 过 程 如 下 : 
S 【 解 】 (1) 提出 假设 :有 7,:P, = 
Hi:P¥P, 
8 (2) 计算 检验 统计 量 
jd A ed a 5 
® 2 人 ET 和 一 4. 276 ,而 Zu 一 2.58 


因为 |1Z| 二 Zoowz ,jp 一 0.01 ,于 是 在 0. 01 显著 性 水 平 上 拒绝 虚无 假设 ,认为 奖学金 
宣传 活动 前 后 ,学 生 对 该 制度 的 态度 有 显著 性 改变 。 

【 例 11-4]】 一 个 50 人 的 班级 对 某 一 班 干部 前 后 两 次 的 民主 评议 如 表 11 -2。 问 前 
后 两 次 评议 结果 是 否 有 显著 性 差异 ? 如 果 在 第 一 次 评议 之 后 ,给 予 该 于 部 一 定 的 指导 和 
帮助 , 问 帮助 有 效 吗 ? 
表 11-2 两 次 民主 测评 结果 


8B{a) 
So 





【 解 】 (1) 提出 假设 : H,:P,=P， 





H,:P\AP: 
(2) 计算 检验 统计 量 : 


12Z| 二 Zw ,所 以 在 0.01 显著 性 水 平 上 拒绝 虚无 假设 ,认为 前 后 两 次 民主 测评 结果 
有 显著 性 差异 ,也 就 是 说 ,对 该 干部 的 指导 帮助 是 有 效 的 。 


第 四 节 ”独立 样本 比率 的 差异 检验 


一 、 独 立 样本 比率 差异 的 抽样 分 布 


从 一 个 总 体 比 率 为 P . 另 一 个 总 体 比 率 为 P, 的 两 个 二 项 分 布 总 体 中 独立 地 抽取 容 
量 为 mw, 和 的 两 个 样本 ,比率 之 差 为 pi 一 p:。 和 如 果 随 机 抽取 所 有 可 能 独立 样本 组 合 , 并 
上 且 对 每 对 组 合计 算 两 个 样本 的 比率 之 差 ,就 形成 了 两 独立 样本 比率 之 差 的 抽样 分 布 。 当 
样本 容量 足够 大 ,上 且 两 个 样本 的 最 小 频数 都 大 于 5 时 ( 即 关 户 二 5,mg 二 5 县 天 包 一 3， 
nq; 二 5) ,独立 样本 比率 之 差 的 抽样 分 布 接近 正 态 。 

独立 样本 比率 之 差 的 抽样 分 布 的 平均 数 ,就 等 于 样本 所 来 目 的 两 个 总 体 的 比率 
差 , 即 : 


Hn Ne 人 (公式 11 - 12) 
独立 样本 比率 之 差 的 抽样 分 布 的 标准 误 : 
on n= VT Fa = /+ (公式 11 -13) 


当 总 体 比 率 未 知 时 ,可 以 用 两 样本 比率 p, 和 ps 作为 PP 和 P; 的 点 估计 值 ,所 以 样 
本 比率 之 差 标准 误 的 估计 值 为 : 


Ss, ., =, /PE EE (公式 11-14) 
n 


二 、 检 验 假设 与 虚无 假设 


独立 样本 比率 差异 显著 性 检验 ( 双 侧 ) 的 统计 假设 是 : 

虚无 假设 H, :P, =P; ,表明 样本 所 来 自 的 两 个 总 体 的 比率 P! 和 P: 无 显著 性 差异 ， 
即 两 个 样本 来 自 同 一 个 总 体 , 样 本 所 表现 出 来 的 比率 差异 是 由 随机 抽样 误差 引起 的 。 

研究 假设 Hi :P, 天 P, ,表明 样本 所 来 自 的 两 个 总 体 的 比率 P! 和 P: 之 间 存在 显著 
性 差异 ,样本 所 表现 出 来 的 比率 差异 无 法 仅 由 随机 抽样 误差 所 解释 ， 


三 、 检 验 统计 量 的 计算 


进行 独立 样本 差异 的 显著 性 检验 时 ,样本 所 来 自 的 两 个 总 体 比率 PP 和 P; 都 未 知 ， 
可 以 利用 两 样本 的 比率 p, 和 户 作为 其 点 估计 值 。 因 为 事先 假设 两 总 体 比率 相等 ,两 个 
样本 来 自 同一 总 体 ,所 以 两 样本 比率 p, 和 p: 都 可 以 作为 总 体 比率 P 的 点 估计 值 ,这 时 


[TILLLE 


eg@@@ 请 蔗 放 知 末 车 册 区 其 | 十 洲 





就 用 两 样本 比率 的 加 权 平 均 数 作为 总 体 比率 的 估计 量 , 所 以 ，; 
P pt np 


Fe 《公式 11 一 15) 
} 2 
1 po 人 Tng AN 
Q=1—P,— (公式 11 - 16) 
1 2 


ss i i 和 过 ， 有 Cn pi nz pi) (ng nd) AN 
Sn -六 =0p, -Pp, = PQ.( 直 + 志 ) | ee re, i (公式 11 -17) 


那么 ,独立 样本 比率 差异 的 显著 性 检验 的 统计 量 计算 公式 为 : 


Z= “如 一 各 3 一 一 ?因为 检验 的 虚无 假设 是 P, 一 P,, 所 以 ， 


,ee Ph st DR 办 Dp: 
Sh, ~ (mp + ns ps ) (mg 十 mizgy ) 


Hinz (Cn 十 ?is ) 


(公式 11 -18) 


四 、 统 计 决 策 
如 果 检 验 统 计量 1Z| 二 2 , 则 拒绝 虚无 假设 ,认为 两 总 体 比 率 存在 显著 性 差异 ;如 果 
检验 统计 量 |1Z1 一 Z.:，* 则 接受 虚无 假设 ,认为 两 总 体 比率 差异 不 显著 ,样本 比率 所 表现 出 








章 ”来 的 差异 更 可 能 是 由 抽样 误差 引起 的 ， 
儿 【 例 11-5】 为 了 比较 两 种 复习 方法 的 效果 ,随机 抽取 240 名 被 试 再 随机 分 为 两 组 。 
2 两 组 被 试 分 别 使 用 不 同 的 复习 方法 ,在 复习 一 段 时 间 后 ,分 别 施 以 同一 测验 ,测验 结果 如 
表 11 -3 所 示 。 能 否认 为 两 种 复习 方法 的 效果 不 同 ? 
表 11-3 240 名 被 试 的 测验 成 绩 
入 优良 一 般 合计 
复习 方法 A 64 56 120 
® 复习 方法 B 146 74 120 
合计 110 130 240 





【 解 】 两 个 独立 样本 各 自 独立 地 采用 不 同 的 复习 方法 学 习 , 本 例 采 用 独立 样本 比率 
的 显著 性 检验 来 比较 两 组 被 试 考试 成 绩 的 优良 率 。 由 已 知 条 件 知道 ， 

样本 1:m 一 120, 思 一 0.533,0 = 二 1 一 pi ==0. 467; 

样本 2;n; 一 120, ps 二 0. 383,q; 二 1 一 p= 二 0. 617; 

提出 假设 :虚无 假设 日 , :P, = P; ;研究 假设 H,;P, 关 P， 

检验 统计 量 的 计算 ,将 上 述 数 据 代 入 公式 11 - 18 即 可 得 到 ， 


8 可 
7 一 一 一 一 所 一 一 一 一 一 5 0 
Cm pt ns ps) (ng ng,) (64 十 46)X(56 十 74) 
AN nn (941 十 my ) AN 120X120X240 


而 Zoiosss 一 1.96 
所 以 121 二 Zu 可 在 0.05 显著 性 水 平 上 拒绝 虚无 假设 ,采用 两 种 不 同 复习 方法 的 
两 个 独立 样本 的 优良 率 存在 显著 性 差异 ,可 以 认为 两 种 复习 方法 的 效果 不 同 。 


240 十 村 太志 


第 五 节 比率 假设 检验 的 SPSS 过 程 


一 、 单 样本 比率 检验 的 SPSS 过 程 


前 文 已 经 讨论 过 ,样本 比率 的 抽样 分 布 符合 二 项 分 布 ,可 以 采用 二 项 分 布 检验 的 方 
法 来 完成 样本 与 总 体 比 率 的 差异 性 检验 。 

在 实际 调研 中 ,经 常会 遇 到 非 此 即 彼 的 二 项 选择 ,而 在 此 类 调研 中 我 们 期 望 了 解 被 
调查 样本 中 二 项 选择 的 分 布 情况 ,如 两 项 选择 的 比例 是 否 相 等 , 或 是 否 满足 某 种 比例 关 
系 (如 1:3.1:10 等 )。 这 就 需要 使 用 二 项 分 布 检验 方法 和 程序 。 下 面 通过 例题 的 形式 介 
绍 这 一 SPSS 过 程 。 

【 例 11-6】 表 11-4 中 的 数据 是 某 班 30 名 同学 的 英语 期 终 考试 成 绩 , 并 且 将 成 绩 
等 级 划分 为 “优良 "和 “未 达到 良好 ”, 用 1 表示 “优良 ”、2 表示 "未 达到 良好 ”。 如 果 考 虑 到 
误差 因素 ,能 否认 为 该 班 同学 英语 的 真实 成 绩优 良 率 达到 80%。 


表 11-4 30 名 学 生 的 英语 成 绩 及 其 等 级 


EEIEELIEEICEY 
| 82. 00 82.00 
87. 00 91.00 
85. 00 70.00 
70. 00 79. 00 
73. 00 68, 00 
65.00 70.00 
90. 00 89. 00 
95.00 82.00 
98. 00 83. 00 
85.00 82.00 
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步骤 1: 建立 正确 的 数据 文件 

根据 题 意 ,本 例 只 有 一 个 30 人 组 成 的 研究 样本 ,所 以 建立 SPSS 数据 文件 时 不 需要 
分 组 变量 。 每 个 学 生 的 信息 包括 其 以 百分制 记录 的 英语 考试 分 数 和 所 达到 的 等 级 ,优良 
等 级 记 为 1 .未 达到 良好 的 记 为 2。 所 以 这 一 SPSS 数据 文件 包括 30 个 个 案 行 .2 个 变量 
列 , 如 图 11 -1 所 示 。 

步骤 2: 打 开 对 话 框 并 完成 界面 设置 

单 击 “Analyze” 选 择 “Nonparametric Tests”( 非 参 数 检验 ) 中 的 “Binomial Test” 命 
令 , 打 开 二 项 分 布 检验 对 话 框 , 如 图 11-2 所 示 。 在 左 侧 的 变量 列表 中 选择 “等 级 " 变 基 ， 
点 击 " 国 网 "将 其 置信 ”Test Variables List* 下 的 方 框 中 。 

在 对 话 框 上 “Define Dichotomy” 栏 指定 对 个 案 的 二 分 方法 。 当 检 验 变量 本 身 就 是 二 
分 变量 的 时 候 , 就 采用 系统 默认 的 “Get from data”， 直接 从 数据 文件 中 读 取 二 分 变量 数 
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图 11-1 单 样本 比率 检验 的 数据 文件 与 菜单 示 章 图 
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图 11-2 二 项 分 布 检验 对 语 框 


据 ; 当 检 验 变量 是 连续 变量 或 多 等 级 变量 时 , 色 选 “Cut point” 激 活 其 后 的 小 方 框 ,输入 一 
个 具体 数值 ,使 得 对 应 变量 值 小 于 等 于 此 数值 的 被 试 被 自 动 定义 为 第 一 组 ,大 于 该 数值 
的 被 试 被 定义 为 第 二 组 。 本 例 采 用 默认 方式 即 可 。 

在 Test Proportion 框 中 输入 检验 值 , 即 为 总 体 比 率 或 假设 的 总 体 比 率 , 其 系统 默认 
为 0.5, 本 例 中 总 体 比率 被 假设 为 0.80, 所 以 需要 将 0. 50 改 为 0. 80" 这 里 需要 特别 注意 

个 问题 :对 话 框 中 输入 的 总 体 比 率 值 是 指 在 数据 文件 中 第 一 个 个 案 所 在 类 占 总 体 的 比 

率 , 本 例 中 第 一 个 个 案 是 属于 “优良 "等 级 ,因为 本 例 所 检验 的 总 体 比率 假定 为 0. 80, 所 以 
输入 0.80。 假 如 在 本 例 的 数据 文件 中 ,第 一 个 个 案 基 局 “2” 即 “未 达到 良好 ”者 ,那么 按 
照 假设 ,未 达到 良好 者 的 总 体 比 率 被 假定 为 0.20, 这 时 就 需要 输入 0. 20 而 不 是 0. 80。 

完成 上 述 操作 后 , 单 击 “OK" 按 钮 输出 检验 结果 。 
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步骤 3: 结 果 的 读 取 与 解释 
就 比率 检验 本 身 来 说 ,其 输出 的 结果 主要 就 是 一 个 表格 ,如 表 11-5 所 示 。 
表 11-5 二 项 分 布 检验 结果 (Binomial Test) 


Category N Observed Prop. Test Prop, Asymp. Sig. (1 一 tailed) 
Group 1 1.00 22 1 .8 .247 
Group2 2.00 8 .3 
Total 30 i 





表 11-5 显示 ,30 个 个 案 中 ,英语 成 绩 达 到 优良 等 级 的 有 22 人 、 未 达到 优良 等 级 的 
有 8 人 ,所 占 比 率 分 别 为 0.7.0.3。 优 良 率 与 0. 80 之 间 的 差异 未 达到 显著 性 水 平 (显著 
性 水 平 为 0. 247 二 0. 05) ,所 以 不 能 拒绝 虚无 假设 ,可 以 认为 该 班 同学 的 优良 率 基 本 达 
到 80%。 


二 、 相 关 样 本 比率 检验 的 SPSS 过 程 


相关 样本 比率 的 差异 性 检验 涉及 到 两 个 数据 样本 ,而 且 丁 个 样本 之 间 可 能 存在 相 
关 , 可 以 使 用 SPSS 系统 的 “Nonparametric Tests” 中 的 “McNemar" 命 令 来 完成 。Me- 
Nemar 检验 法 适合 于 两 个 相关 样本 的 二 分 变量 总 体检 验 。 以 例题 说 明 这 一 SPSS 过 程 。 

【 例 11-7]】 某 体育 教师 为 改进 学 校 体育 工作 ,有 效 增进 学 生体 质 并 提高 其 体育 达 
标 率 , 他 对 学 生 进行 了 一 段 特 训 , 表 11 -6 中 数据 即 为 20 名 学 生 在 训练 前 后 的 达标 测试 
结果 ,其 中 0 表示 “不 达标 ”、1 表示 "达标 ”。 请 问 特 训 前 后 学 生 的 达标 率 是 否 有 显著 
变化 ? 

步骤 1: 建 立正 确 的 数据 文件 

根据 题 意 ,本 例 只 有 一 个 20 人 组 成 的 研究 样本 ,但 是 每 人 均 参 加 了 两 次 测试 ,测试 
结果 记 为 “达标 ”或 “不 达标 ”, 所 以 建立 SPSS 数据 文件 时 不 需要 分 组 变量 ， 每 个 学 生 的 
测试 信息 包括 训练 前 后 两 次 ,所 以 这 一 SPSS 数据 文件 包括 20 个 个 案 行 2 个 变量 列 , 如 
图 11 -3 所 示 。 


表 11-6 体育 训练 前 后 学 生 达 标 测试 结果 登记 表 

















训练 前 训练 后 





序号 训练 前 训练 后 














1 1 11 1 1 
0 1 12 ] D 
0 0 13 D 1 
1 1 14 0 1 
0 1 15 l ] 
0 1 16 0 1 
1 ] 17 D 1 
0 0 18 0 0 
0 1 19 0 1 
0 1 20 1 


步骤 2: 打 开 对 话 框 并 完成 界面 设置 


909 全 全 近 访 庄村 沐 对 册 耳 吉 | 十 浇 


243 


相关 料 本 比 李 的 差异 性 检验 一 5PS5 Data Editor 
Bile Edit Yiew Deate Transforn 下 2 Graphs Wtilities Window Hely 


SIals| | | | 本 站 er | 
1 : 训 统 前 1 


Dascriptive Statistics 
Custon Tables 


Compare Meuns 


General Linear Model 

Mxed Nodels 

Correlate 

Beeression 

Loglinear 

Classi fy 

Data Reduction 

Scale 
Chi-~Square 

Time Series Binomial 

Surviveal Bans 

Waltiple Response l-Swple K-S 

Missine Value Analysis 2 Independent Sanples 
E Independent Sanples 


= 
Le on 小 


已 号 一 一 忆 号 一 握 口 一 已 口 


“| a 


elated Suples 


Data View 人 人 Variable Viev 7 | K Related Sunples 


2 Related Sanplas SFSS Processor is ready 





图 11-3 相关 样本 比率 差异 检验 的 数据 文件 与 菜单 示意 图 
单 击 “Analyze”" 选 择 “Nonparametric Tests”( 非 参数 检验 ) 中 的 “2 Related Sample ” 
命令 ,打开 两 个 相关 样本 分 布 检 验 对 话 框 ,如 图 11 -4 所 示 。 在 左 侧 的 变量 列表 中 同时 选 
择 对 应 的 两 个 变量 名 形成 配对 变量 列 , 本 例 中 为 “训练 前 ”与 "训练 后 ,点击 国 罗 "将 配 
对 变量 置 人 “Test Pairs List" 下 的 方 框 中 。 在 检验 类 型 *Test Type" 栏 中 勾 选 “Mec- 
Nemar”, 单 击 "“OK" 即 可 输出 结果 ， 
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图 11-4 两 个 相关 样本 的 二 项 分 布 检验 对 话 杠 
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步骤 3: 结果 的 读 取 与 解释 

就 两 个 相关 样本 的 比率 检验 来 说 ,其 输出 的 结果 主要 有 两 部 分 ,一 部 分 是 对 两 个 相 
关 样 本 中 二 分 类 情况 的 统计 ,如 表 11 -7 所 示 ; 另 一 部 分 是 两 个 样本 比率 的 差异 显著 性 检 
验 结果 ,如 表 11 -8 所 示 。 


表 11-7 训练 前 后 达标 与 不 达标 情况 
训练 后 





表 11-7 显示 ,训练 前 后 都 不 达标 的 有 3 人 ,经 过 训练 由 不 达标 变 为 达标 的 有 10 
人 ,由 达标 变 为 不 达标 的 有 1 人 ,训练 前 后 都 能 达标 的 有 6 人 。 
表 11-8 训练 前 后 达标 比率 显著 性 水 平 (Test Statistics) 
达标 前 & 达标 后 







N 
Exact Sig. (2— tatled) 





表 11-8 显示 ,两 个 相关 样本 比率 显著 性 检验 的 伴随 概率 为 0.012, 即 差异 的 显著 性 
水 平 达到 了 0. 012 ,小 于 0.05, 所 以 拒绝 虚无 假设 ,可 以 认为 训练 前 后 学 生 的 达标 率 发 生 
了 显著 性 变化 。 


三 、 独 立 样 本 比率 检验 的 SPSS 过 程 


在 SPSS 中 ,可 以 利用 交叉 列 联 表 (Crosstab) 来 进行 独立 样本 比率 的 差异 性 检验 。 
交叉 列 联 表 分 析 除 了 可 以 列 出 交叉 分 组 下 的 频数 分 布 , 还 可 以 分 析 两 个 变量 之 间 是 否 具 
有 独立 性 或 一 定 的 相关 性 。 如 果 两 个 变量 之 间 相 互 独立 ,一 个 分 组 变量 所 形成 的 不 同类 
间 的 比率 并 不 受 另 一 分 组 变量 的 影响 ;如 果 两 个 变量 存在 相关 ,就 意味 着 一 个 分 组 变量 
所 形成 的 不 同类 间 的 比率 受 另 一 分 组 变量 的 影响 ,这 第 二 个 分 组 变量 所 划分 出 来 的 两 个 
独立 组 的 比率 差异 显著 。 所 以 ,两 个 独立 组 之 间 的 比率 差异 性 可 以 用 交叉 列 联 表 方法 来 
检验 。 比 如 就 例 11 -5 来 说 ,其 中 实际 上 存在 两 个 分 组 变量 ,一 个 变量 是 复习 方法 ,分 A 
和 B; 另 一 个 分 组 变量 是 成 绩 等 级 ,分 "优良 "和 "一 般 ”"。 要 检验 在 A 方法 组 和 B 方 法 组 
里 ,“ 优 良 " 的 和 "一 般 " 的 比率 是 否 有 显著 性 差异 ,就 成 了 两 个 分 组 变量 是 否 具 有 显著 性 
交叉 相关 的 问题 了 。 

现在 ,就 以 例 11 - 5 中 的 数据 来 说 明 独 立 样本 比率 检验 的 SPSS 过 程 。 

步骤 1: 建 立 SPSS 数据 文件 并 作 加 权 处 理 

根据 题 意 ,已 知 条 件 包括 三 个 变量 ,复习 方法 分 两 个 水 平成 绩 等 级 分 两 个 水 平 、 两 
个 分 组 变量 划分 出 来 的 四 个 独立 组 中 的 人 数 。 每 个 学 生 的 原始 测试 成 绩 未 给 出 。 所 以 
这 一 数据 按照 汇总 后 的 资料 来 建立 ,还 是 设 三 个 变量 列 ,但 只 能 有 四 个 个 案 行 ,但 是 这 里 的 
一 个 个 案 行 并 不 是 代表 一 个 个 案 , 而 是 代表 四 个 独立 的 样本 组 。 数 据 文件 如 图 11 -5 所 示 。 

因为 这 个 文件 是 根据 汇总 后 的 结果 建立 的 ,所 以 进行 统计 分 析 之 前 必须 对 数据 性 质 
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图 11~-5 两 个 独立 样本 比率 的 差异 检验 的 数据 文件 


进行 一 定 的 转换 :在 这 个 例子 中 ,研究 的 全 部 被 试 实际 上 基 2 和 个 ,所 以 不 能 直接 以 四 个 
个 案 来 反映 研究 的 数据 结构 。 我 们 可 以 很 容易 地 看 到 ,数据 区 的 每 一 行 反映 的 并 不 是 一 
个 被 试 的 信息 ,如 第 一 行 是 代表 了 64 人 的 信息 、 第 二 行 代 表 了 56 人 的 信息 ,…, 为 了 使 
计算 机 能 “认识 "到 这 一 点 ,必须 根据 人数” 对 每 一 行进 行 * 加 权 ”, 即 将 "人数" 作为 加 权 
变量 来 看 待 。 

加 权 处 理 的 方法 是 : 单 击 菜 单 *“Data" 选 择 "Weight Cases…” 命 令 打 开 对 话 框 , 勾 选 
“Weight Cases by” 激 活 对 应 的 方 框 ,然后 将 变量 "人 数 " 置 人 到 “Frequency Variable" 之 
下 的 方 框 中 , 单 击 *OK" 即 完成 加 权 变 量 的 设置 

对 2: 打 开 对 话 框 并 完成 界面 设置 

单 击 菜单 “Analyze" 选 择 “Descriptive Statistics” 中 的 “Crosstabs….” 命令 ,打开 交叉 
列 联 表 分 析 对 话 框 ,如 图 11 -6 所 示 。 然 后 将 不 同 的 分 组 变量 分 别 置 人 到 行 变 量 框 中 
(Rows) 和 列 (Columns) 变 量 框 中 ,本 例 中 将 “复习 方法 "作为 行 变量 “成 绩 等 级 ”作为 列 
变量 ,如 图 11-6 所 示 ， 
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图 11~6 交叉 列 联 表 分 析 的 对 话 杠 
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单 击 “Statistics…" 按 钮 打开 相应 的 对 话 框 ,并 勾 选 对 话 框 上 的 “Chi-square "项 ( 意 为 
采取 卡 方 检验 。 注 :关于 卡 方 检验 的 详细 讨论 见 下 一 章 )。 单 击 "Continue” 返 回 交 叉 列 联 
表 分 析 的 主 对 话 框 ,最 后 点 击 "OK"” 按 钮 即 可 输出 结果 。 

步骤 3: 结果 的 读 取 与 解释 

独立 样本 比率 的 差异 检验 借助 于 交叉 列 联 表 分 析 方 法 ,其 输出 结果 主要 是 卡 方 检验 
的 结果 。 就 本 例 来 说 ,其 主要 结果 如 表 11 -9 所 示 。 

表 11-9 交叉 列 联 表 分 析 结 果 ( 卡 方 检验 :ChirSquare Tests) 


Value df Asymp. Sig. (2-sided) 


Pearson Chi-Square 5. 438 1 .020 

Continuity Correction 4. 850 1 .028 

Likelihood Ratio 5.459 1 .019 

Linear-by-Linear Association 5.415 1 ,020 
N of Valid Cases 240 . 





表 11 -9 中 的 结果 显示 ,x’ 二 5.438, 伴 随 概率 p= 二 0.020 二 0.05。 所 以 可 以 认为 “ 复 
习 方 法 ”与 “成 绩 等 级 ”两 个 变量 之 间 并 非 独 立 , 而 是 存在 相关 性 。 换 句 话说:“ 复 习 方法 ” 
不 同 , 则 学 生 在 "成绩 等 级 ”上 的 人 数 分 布 也 不 同 ,这 是 因为 不 同 复习 方法 产生 的 效果 
不 同 。 
表 中 还 同时 输出 了 其 他 检验 方法 得 到 的 结果 ,效果 非常 接近 ,可 以 互相 替代 。 对 于 
这 些 方 法 ,此 处 不 再 装 述 。 


和 一 复习 思考 与 练习 是 二 一 4 


1. 从 某 校 随机 抽取 高 三 学 生 50 名 ,其 中 体育 不 达标 者 有 7 人 ,计算 该 校 高 三 学 生体 
育 不 达标 人 数 的 95 儿 的 置信 区 间 ,或 高 三 学 生体 育 不 达标 人 数 的 置信 区 间 。 

2. 假定 某 一 年 某 省 高 考 报名 人 数 309876 人 ,最 后 被 录取 人 数 为 180859 大。 而 当年 
全 国 高 考 录 取 率 为 52%, 能 否认 为 该 省 的 高 考 录 取 率 高 于 全 国 录 取 率 ? 

3. 某 研究 者 随机 抽取 20 名 儿童 做 注意 力 发 展 实验 。 在 实验 前 后 分 别 对 儿童 进行 一 
次 注意 品质 检测 ,结果 如 表 11 - 10 所 示 。 根 据 表 中 数据 ,能 否认 为 实验 前 后 儿童 的 注意 
品质 有 显著 性 变化 ? 


9@ 委 四 盱 气 诗 居 障 卫 由 一 册 | 十 游 


表 11-10 儿童 注意 品质 检测 结果 





第 一 次 测验 
一 一 会 计 
达到 标准 未 达到 标准 量 
达到 标准 | 12{b) 6 
第 二 次 测验 
未 达到 标准 2(c) 2(d) 4 
合计 6 14 20 





4. 某 大 学 在 教学 评估 期 间 对 学 生 的 上 课 情 况 进行 抽查 ,分 别 随机 从 一 年 级 、 二 年 级 
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中 各 抽查 了 38 名 和 36 名 学 生 的 出 惑 情 况 ,结果 如 表 11 - 11 所 示 。 能 否认 为 两 个 年 级 学 
生 的 出 勒 率 有 显著 性 差异 ? 
了 11-11 两 个 年 级 学 生出 戎 抽查 结果 
出 勤 峡 课 合计 
1 年 级 36 多 一 38 
2 年 级 30 6 36 
合计 66 8 74 


第 十 二 章 卡 方 (X2 ) 检 验 


X* 检验 是 分 析 计 数 资料 的 最 常用 的 非 参 数 检验 方法 , 它 实际 上 是 一 种 差异 性 检验 技 
术 , 即 对 观测 样本 中 的 次 数 分 布 形态 与 某 种 假设 或 理想 的 次 数 分 布 形态 的 差异 性 进行 检 
验 , 或 是 对 不 同样 本 间 次 数 分 布 的 差异 性 进行 检验 。 概 括 地 说 ,x* 检验 主要 包括 适合 度 
检验 和 独立 性 检验 ,其 中 独立 性 检验 是 对 不 同 分 类 变量 间 是 否 相 互 独立 的 检验 。 本 章 介 
绍 的 x* 检验 在 SPSS 系统 的 实现 过 程 是 基于 次 数 统计 之 后 的 资料 。 


1936 年 ,乔治 . 盖 洛 普 赁 借 民 意 调 查 的 方式 成 功 地 预测 了 美国 总 统 大 选 的 结果 ,此 
后 ,民意 调查 成 为 美国 以 及 其 他 许多 国家 政治 和 经 济 生活 中 常用 的 信息 获取 手段 。 毫 无 
疑问 ,通过 民意 调查 得 到 的 资料 主要 是 计数 资料 ,那么 如 何 分 析 这 些 计 数 数据 才能 从 有 
限 的 样本 调查 推断 广泛 的 民意 呢 ? 本 章 介 绍 的 卡 方 检验 正 是 处 理 这 些 计数 资料 常用 的 、 
有 效 的 方法 。 


第 一 节 ”x 检验 的 基本 原理 


一 、 行 为 科学 中 的 计数 资料 


心理 与 行为 科学 研究 中 ,除了 借助 于 等 距 、 等 比 量 表 获 得 的 一 些 计 量 数据 外 ,还 常常 
会 借助 于 称 名 量 表 或 等 级 量 表 获 取 一 些 计数 资料 。 例 如 ,在 民意 调查 中 ,将 公众 的 意见 
分 为 “赞成 “反对 ”、“ 不 确定 ”三 类 ,然后 可 以 得 到 三 类 选择 的 人 次 比较 ;在 产品 质量 评 
价 中 ,将 产品 的 质量 分 为 “很 好 ”"“ 较 好 ”“ 中 等 "“ 较 差 "“ 很 差 " 五 个 等 级 ,然后 可 以 获 
得 每 一 等 级 上 的 人 数 ,……… ,这 样 的 数据 资料 都 属于 计数 资料 。 另 外 ,根据 研究 的 需要 ， 
一 些 连 续 变 化 的 数据 资料 也 可 以 转换 为 计数 资料 ,比如 按照 一 定 的 分 数 线 将 学 生 的 考试 
成 绩 划分 为 “合格 "和 “不 合格 ”两 个 类 别 后 ,统计 两 类 成 绩 的 学 生 人 数 ,这 样 就 将 计量 资 
料 转换 成 了 计数 资料 。 

下 面 ,就 几 个 研究 范例 来 具体 了 解 一 下 心理 与 行为 研究 中 的 计数 资料 形式 ,以 及 这 
类 数据 资料 所 面临 的 统计 分 析 问 题 。 

1 . 磺 牌 将 查 

【 例 12-1】 某 广 告 公司 为 一 种 商品 设计 了 四 种 不 同类 型 的 外 包装 。 为 了 解 哪 一 种 
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设计 的 效果 更 能 够 引起 消费 者 的 购买 欲 , 公 司 将 这 四 种 包装 的 相同 产品 并 排 陈 列 在 超市 
货架 上 ,一 段 时 间 后 ,统计 到 有 200 位 顾客 购买 了 该 种 产品 ,不 同 包装 的 选择 人 数 如 表 
12-1 所 示 。 那 么 ,能 和 否 借 此 推断 顾客 对 四 种 包装 设计 的 癌 好 度 确实 存在 差异 ? 
表 12-1 四 种 不 同 包 装 的 同一 种 产品 的 购买 人 数 
包装 类 型 A B C D 合计 
购买 人 数 42 59 48 51 200 


此 例 研 究 的 是 产品 选择 问题 ,可 以 是 对 同一 品牌 不 同色 装 设计 的 选择 ,也 可 以 是 对 
同一 种 产品 的 不 同 品牌 的 选择 ,总 而 言 之 ,是 通过 消费 者 对 不 同 产品 购买 的 发 生 频率 反 
上 映 何 种 营销 策略 更 为 有 效 ,或 者 研究 消费 者 的 心理 活动 规律 ,这 种 方法 是 市 场 调查 中 最 
为 常用 的 手段 。 这 个 例子 中 只 涉及 到 一 个 分 类 维度 ,是 单 变量 的 研究 。 资 料 分 析 的 统计 
任务 就 是 通过 样本 频数 的 分 布 对 样本 所 在 总 体 的 分 布 做 出 推断 。 

2. 六 厦 取向 评 俯 

【 例 12 - 2】 某 省 最 近 出 台 了 新 的 高 考 制度 ,为 了 解 学 生 对 这 一 高 考 新 模式 的 态度 ， 
一 位 教师 从 自己 所 在 学 校 的 高 中 生 中 随机 抽取 了 90 名 学 生 进 行 调查 ,其 中 男生 40 人 ， 
女生 50 人 。 调 查 的 问题 是 : 

作为 一 名 高 考 备考 生 , 您 对 最 近 新 推出 的 高 考 方案 持 什么 态度 ? 请 从 下 列 三 个 备 选 
项 中 选择 一 项 最 符合 您 想法 的 选项 。 

A. 玩 成 B. 反对 C. 无 所 谓 

学 生 选 择 的 情况 汇总 如 表 12 -2 所 示 。 那 么 该 校 学 生 对 高 考 新 方案 的 态度 存在 性 别 
差异 吗 ? 


表 12-2 男女 生 对 高 考 新 模式 的 态度 





这 一 问题 涉及 到 社会 民意 调查 中 最 常见 的 资料 类 型 , 即 态 度 但 好 ,这 里 的 态度 类 别 
具有 等 级 性 质 , 它 统计 的 数据 反映 的 是 被 坛 人 数 在 各 态度 等 级 上 的 分 布 。 这 类 调查 还 往 
往 涉及 到 不 同 的 人 群 ,所 得 资料 面临 的 分 析 任 务 主 要 有 两 个 :一 是 分 析 调 查 对 象 总 体 的 
主要 态度 偏向 ,二 是 比较 不 同 被 试 群体 的 态度 偏向 是 否 存在 差异 。 

3. 成 线 敬 级 评定 

【 例 12-3】 在 高 校 教 学 管理 中 ,往往 采用 学 生 评 教 的 方法 促进 教学 。 比 如 , 某 一 学 
期 末 , 有 三 个 班 的 学 生 对 同一 位 英语 教师 的 教学 质量 进行 了 评价 ,结果 如 表 12 -3 所 示 。 
那么 这 三 个 班级 的 学 生 对 这 位 教师 的 评价 是 否 存 在 明显 差异 呢 ? 

这 一 问题 涉及 到 对 人 、 事 或 物 的 评价 问题 ,也 是 教育 学 .心理 学 研究 中 常见 的 问题 。 
像 表 12 -3 中 的 数据 资料 ,其 统计 分 析 面 临 的 问题 也 主要 有 两 个 方面 ,一 是 被 试 总 体 评价 
等 级 的 人 数 分 布 及 其 差异 性 问题 ,二 是 不 同 的 被 试 群体 评价 取向 的 差异 性 问题 。 


表 12-3 三 个 班 的 学 生 对 一 英语 教师 教学 的 评估 结果 





上 述 例子 中 的 数据 资料 都 是 计数 资料 ,一 般 都 是 借助 于 称 名 量 表 或 等 级 量 表 获 得 
的 ,而 且 这 类 资料 不 能 采用 前 述 介绍 的 各 种 参数 分 析 方法 来 处 理 , 只 能 采用 非 参 数 检验 
方法 ,主要 是 卡 方 检验 来 进行 分 析 和 推断 。 卡 方 检验 适用 于 计数 资料 的 分 析 。 由 于 卡 方 
检验 这 一 独特 的 便利 性 , 它 在 心理 学 等 行为 科学 研究 领域 具有 广泛 的 应 用 价值 . 

上 一 章 中 的 某 些 资 料 也 可 以 通过 卡 方 检验 来 完成 。 


二 、x? 分 布 及 其 应 用 领域 


1 .4 分布 

卡 方 检验 所 依据 的 分 布 是 卡 方 分 布 。 卡 方 分 布 是 一 种 正 偏 态 分 布 , 其 自由 度 不 同 
时 ,分 布 曲 线 的 偏 斜 程度 也 会 不 同 。 卡 方 分 布 的 统计 量 用 希腊 字母 x* 表示 。 

上 长 方 分 布 曲线 下 的 总 面积 为 1, 不 同 显著 性 水 平 下 (曲线 下 方 右 侧 的 面积 ) 的 卡 方 临 
界 值 见 附 表 9 所 示 , 卡 方 检验 一 般 采 用 的 是 单 侧 检验 。 在 计算 出 自由 度 后 ,根据 显著 性 
水 平 要 求 ,在 卡 方 临界 值 表 中 查 出 临界 值 , 如 果 计 算 的 卡 方 值 大 于 这 个 临界 值 ,说 明 卡 方 
值 对 应 的 曲线 下 右 侧 的 面积 小 于 这 个 显著 性 水 平 对 应 的 a 值 。 例 如 , 当 自由 度 为 5 时 ,0. 
05 显著 性 水 平 对 应 的 临界 值 是 11. 1, 这 就 是 说 ,在 自由 度 为 5 的 卡 方 分 布 曲线 下 , 卡 方 
值 大 于 11. 1 的 右边 尾部 的 面积 是 0.05。 

图 12 -1 给 出 了 自由 度 分 别 为 1.4、10、20 时 的 x 分 布 概率 密度 函数 曲线 。 





0 5 0 3 0 DN 
图 12-1 不 同 自由 度 下 卡 方 分 布 的 密度 函数 曲线 


由 图 12 -1 可 以 看 出 , 卡 方 分 布 具有 以 下 的 特点 ， 

(1) 卡 方 值 都 是 正 值 。 

(2) 卡 方 分 布 呈正 偏 态 , 右 端 无 限 延伸 ,但 永 不 与 基线 相交 。， 

(3) 卡 方 分 布 随 自由 度 的 变化 而 形成 了 一 族 分 布 。 自 由 度 不 同 , 卡 方 分 布 曲线 的 形 
状 也 不 同 : 自 由 度 越 小 ,分 布 越 偏 斜 ;自由 度 越 大 ,分 布 形态 越 趋 于 对 称 ; 其 极限 分 布 为 正 
态 分 布 , 即 当 df->oo 时 , 卡 方 分 布 即 为 正 态 分 布 。 
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方 分 布 , 即 >》) x 是 一 个 遵从 df=d fi; 十 df 十 dfi 的 x 分布。 这 一 性 质 称 为 卡 方 
变量 的 可 加 性 。 

2.4” 分 市 往 应 用 

卡 方 检验 可 以 用 来 处 理 很 多 离散 型 随机 变量 的 统计 检验 问题 。 当 某 一 事物 或 现象 
的 属性 不 能 用 等 距 量 表 测量 ,只 能 用 称 名 或 等 级 量 表 测量 时 ,由 此 得 到 的 次 数 形式 的 数 
据 , 或 者 由 连续 型 数据 转换 而 来 的 次 数 形式 的 数据 ,都 可 以 进行 卡 方 检验 。 

在 卡 方 检验 过 程 中 ,并 不 涉及 总 体 的 平均 数 ,方差 或 相关 系数 等 参数 ,因此 卡 方 检验 
是 一 种 非 参 数 检验 。 其 主要 用 途 有 两 个 :一 是 用 于 一 个 变量 多 项 分 类 的 资料 ,检验 各 类 
别 的 观察 频数 与 期 望 频数 是 否 吻 合 , 即 适合 性 检验 ;二 是 用 于 两 个 或 两 个 以 上 变量 ,每 个 
变量 又 有 多 项 分 类 的 资料 ,检验 这 两 个 或 两 个 以 上 变量 之 间 是 否 独立 , 即 独立 性 检验 ， 


三 、X 检验 的 基本 原理 


在 实际 研究 中 ,有 时 会 进行 一 些 抽样 调查 ,然后 根据 样本 所 得 的 数据 对 总 体 的 某 些 
特性 做 出 推断 ,例如 民意 调查 等 。 假 设 在 某 次 大 选 期 间 , 民 意 测验 中 心 随 机 抽取 了 1500 
名 选民 ,了 解 他 们 对 三 位 候选 人 的 支持 情况 ,具体 结果 如 表 12 -4 所 示 。 三 位 候选 人 的 支 
持 率 是 否 存在 显著 差异 ? 

表 12-4 假想 的 三 位 候选 人 的 支持 人 数 
候 选 人 Jim Bob Chris 合计 


支持 人 数 。 600 500 400 1500 








表面 上 看 ,支持 Jim 的 人 数 较 多 ,三 位 候选 人 的 支持 率 不 同 。 但 因为 这 是 抽样 研究 ， 
这 种 抽样 调查 结果 可 能 有 以 下 两 方面 的 原因 ， 

(1) 选民 总 体 对 三 位 候选 人 的 支持 率 确实 不 相等 ,所 以 抽取 的 样本 对 候选 人 的 支持 
率 不 相等 ; 

(2) 选民 总 体 对 三 位 候选 人 的 支持 率 实际 上 是 相等 的 ,但 由 于 抽样 误差 而 造成 了 样 
本 对 候选 人 的 支持 率 不 相等 。 

为 进行 差异 显著 性 检验 ,我 们 作出 的 虚无 假设 厅 , 是 :假设 选民 总 体 中 三 位 候选 人 的 
支持 率 相 等 , 即 支持 三 位 候选 人 的 选民 人 数 不 存 在 显著 差异 。 现 在 的 任务 就 是 要 检验 样 
本 频数 的 分 布 是 否 在 抽样 误差 允许 的 波动 范围 内 ,如 果 在 这 个 范围 之 内 , 则 接受 虚无 假 
设 ; 如 果 超 出 了 这 个 范围 , 则 拒绝 虚无 假设 ,认为 总 体 中 三 位 候选 人 的 支持 率 不 相等 , 即 
存在 显著 性 差异 。 

从 样本 中 实际 调查 得 到 的 不 同类 别 的 频数 称 为 观察 频数 f, ,按期 望 分 布 计算 得 到 的 
频数 称 为 期 望 频数 或 理论 频数 f,, 则 卡 方 检验 的 统计 量 : 

好 一 > (公式 12 -1) 


-. 


卡 方 值 反 映 了 实际 的 观察 频数 与 期 望 频 数 的 偏离 程度 : f, 与 f, 总 是 相等 时 ,xy 二 0; 
记 与 f. 相差 很 小 时 ,x* 值 也 很 小 ;f 与 所 相差 很 大 时 ,x 值 也 很 大 。 一旦 x 值 大 于 某 
一 临界 值 ,我 们 就 认为 样本 频数 的 分 布 已 超出 了 抽样 误差 允许 的 范围 ,也 即 样本 所 在 总 


体 的 分 布 不 符合 期 望 分 布 。 

在 某 一 显著 性 水 平 下 ,必定 存在 一 个 临界 值 太 ,, 如 图 12 - 2 所 示 , 若 x 三 必 。* 则 认 
为 观察 频数 与 期 望 频数 的 差异 在 抽样 误差 允许 jo 
的 范围 之 内 ,样本 所 在 总 体 的 分 布 符合 期 望 分 
布 ; 若 好 二 难 。, 则 认为 观察 频数 与 期 望 频 数 的 本 
差异 已 经 超出 了 抽样 误差 允许 的 范围 ,样本 所 
在 总 体 的 分 布 不 符合 期 望 分 布 。 临 界 值 好 ,可 
以 理解 为 在 显著 性 水 平 上 拒绝 虚无 假设 所 必 
须 达 到 的 最 小 x 值 。 图 12-2 卡 方 检 验 示意 图 

需要 注意 的 是 : 卡 方 检验 是 单 侧 检验 ,因为 只 有 当 x* 值 很 大 时 , 即 观察 频数 与 期 望 
频数 相差 很 大 时 ,才能 拒绝 虚无 假设 。 如 果 x: 值 很 小 ,甚至 接近 于 零 , 则 观察 频数 与 其 
望 频数 相差 很 小 ,样本 所 在 总 体 的 分 布 与 期 望 分 布 非常 吻合 ,此 时 接受 虚无 假设 。 也 即 
只 有 当 实际 计算 的 x 值 大 于 临界 值 礁 , 时 , 才 拒绝 虚无 假设 。 


四 、X2 检验 的 主要 步骤 


p 检验 的 一 般 过 程 与 参数 检验 相同 , 它 的 关键 步骤 在 于 期 望 频数 的 计算 和 临界 值 的 
确定 。 现 以 表 12 -4 所 示 的 民意 调查 结果 为 例 说 明 卡 方 检验 的 一 般 过 程 。 

【 解 】 根据 表 12 -4 所 示 的 数据 及 其 结构 ,可 对 样本 数据 进行 卡 方 检验 ,以 分 析 选 民 
总 体 的 态度 。 

步骤 1: 提 出 假设 

虚无 假设 用。 :三 位 候选 人 的 支持 率 不 存在 差异 ; 

研究 假设 Hi :三 位 候选 人 的 支持 率 存在 差异 。 

步骤 2: 计 算 检验 统计 量 x* 值 

在 本 例 中 ,观察 频数 为 实际 调查 所 得 各 位 候选 人 的 支持 人 数 , 分 别 为 600、500、400; 
虚无 假设 中 三 位 候选 人 的 支持 率 不 存在 差异 ,所 以 期 望 频数 均 为 500.500.500。 于 是 : 

= Te 上 六 _《600 一 500) (500 一 500)? ，(400 一 500) 


zs 2 


5 


ee 就 如 表 12 -5 所 示 : 
表 12-5 x 值 计 算 表 











万 fo td tho— fo th— 
赞成 600 500 100 10000 20 
反对 500 500 0 0 0 
不 置 可 否 400 500 100 10000 20 
1500 1500 40 





步 又 3: 统计 决断 
本 例 中 ,数据 分 类 的 类 别 数 上 ==3, 所 以 df 二 3 一 1 二 2。 查 附 表 9 的 x* 值 分 布 表 ， 
WE 好 一 40 二 好 ,拒绝 虚无 假设 ,认为 三 位 候选 人 的 支持 率 存 在 显著 差异 。 
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五 、X 检验 的 连续 性 校正 


当 卡 方 检验 用 于 计数 资料 时 ,由 于 用 分 类 量 尺 或 等 级 量 尺 测 量 的 结果 是 非 连续 型 的 
数据 ,因此 计算 出 的 x* 值 也 是 非 连续 的 。 也 就 是 说 ,这 里 的 x* 是 非 连续 的 离散 型 随机 变 
量 , 当 自由 度 dj 一 1, 扩 二 5 时 ,其 离散 性 尤为 明显 ;但 是 ;x 分 布 本 质 上 是 连续 型 随机 变 
量 的 分 布 形式 。 当 连续 型 分 布 的 结果 应 用 于 离散 型 分 布 时 ,必须 对 连续 性 做 某 些 修正 。 


对 统计 量 大 一 对 “二 全 进行 简单 连续 性 修正 的 方法 是 由 统计 学 家 Frank 
Yates 提出 的 ,因此 这 种 校正 方法 称 为 Yates 连续 
= T= i | (公式 12- 2) 


当 自 由 度 df 二 1, 某 一 分 组 的 期 望 f. 二 5 时 ,必须 用 该 公式 对 x* 值 进行 校正 。 
我 们 将 在 下 面 的 两 节 内 容 中 ,结合 具体 的 问题 来 介绍 这 一 校正 公式 的 应 用 ， 






第 二 节 适合 性 x? 检验 


适合 性 检验 也 称 配 合 度 检验 ,其 主要 原理 是 借助 x* 统计 量 的 实 得 指标 来 考察 观察 
频数 fi 与 某 一 理论 假定 下 的 期 望 频数 f. 之 间 的 差异 是 否 显 著 , 从 而 确定 样本 所 在 总 体 
的 分 布 是 否 与 期 望 分 布 相符 合 。 由 于 适合 性 检验 的 内 容 只 涉及 一 个 分 类 变量 的 计数 资 
料 ,因而 又 称 为 单 因素 x* 检验。 


一 、 适 合 性 x? 检验 的 具体 应 用 


适合 性 检验 中 ,自由 度 df 二 一 m。 其 中 ,# 是 实验 或 调查 中 的 类 别 数 ;m 为 计算 期 
望 频数 时 用 到 的 样本 统计 量 的 个 数 。 通 常情 况 下 ,在 计算 期 望 频数 时 要 用 到 样本 总 数 这 
一 统计 其, 所 以 适合 性 检验 的 自由 度 一 般 为 分 类 的 项 数 减 1。 

适合 性 检验 的 过 程 中 ,要 计算 统计 量 好 ,必须 先 计 算 期 望 频数 。 根据 计算 期 望 频数 
时 所 依据 的 期 望 分 布 的 不 同 ,适合 性 检验 的 应 用 可 大 致 分 为 三 种 情况 。 

1 . 类 灸 频数 慑 内 均匀 分 布 

期 望 频数 服从 均匀 分 是 指 变量 各 项 分 类 的 期 望 频数 相等 ,期 望 频数 等 于 样本 总 数 除 
以 分 类 类 别 数 。 前 一 节 所 举例 12 - 1 的 问题 就 属于 这 一 类 的 适合 性 检验 。 

【 例 12-4】 根据 例 12 -1 提供 的 数据 ,判断 顾客 对 四 种 包装 设计 的 偏好 是 否 存在 
显著 差异 。 

【 解 】 根据 题 意 已 知 : 

样本 容量 N= 二 200, 类 别 数 上 = 二 4,A、B,C.D 四 类 的 实际 观测 次 数 分 别 为 42、59、48、 
和 51。 
检验 的 虚无 假设 及, :顾客 对 四 种 包装 设计 的 喜好 度 不 存在 显著 差异 
根据 虚无 假设 得 出 期 望 次 数 分 布 :f.4 二 f/f.s 二 ff.c=f.5p 一 N/4=50 
所 以 ,检验 统计 量 和 自由 度 分 别 为 : 


了 二 2 98 
df=k—1=4—1=3 : 

查 附 表 9 的 x* 值 分 布 表 , 当 dy 一 3 时 ,从 一 7.81。 由 于 入 一 2.98 一 7. 81, 所 以 接 
受 虚无 假设 ,认为 顾客 对 四 种 包装 设计 不 存在 特别 偏爱 ,对 各 种 包装 设计 的 选择 无 显著 
差异 。 

2. 甚 望 频 数 慑 从 菜 一 经 验 分 布 

期 望 频数 服从 某 一 经 验 分 布 是 指 期 望 频数 服从 某 一 特定 的 比率 ,这 一 比率 是 由 长 期 
的 经 验 总 结 而 来 的 ,各 类 的 期 望 频数 分 别 等 于 样本 总 容量 与 相应 类 别 所 占 比率 的 乘积 。 

【 例 12-5】 某 高 校 教 务 处 统计 了 多 年 来 全 校本 科 毕 业 生 毕业 论文 成 绩 的 等 级 分 布 
情况 ,如 表 12 -6 所 示 。 今年 某 学 院 150 名 本 科 毕 业 生 的 论文 成 绩 等 级 分 布 也 列 人 了 表 
12 -6, 试 分 析 该 学 院 今年 对 毕业 生 毕 业 论 文 的 成 绩 评定 是 否 符合 全 校 多 年 来 平均 的 成 
绩 分 布 模式 ? : 

表 12-6 某 高 校 学 生 毕 业 论文 成 绩 等 级 分 布 和 某 学 院 今 年 毕业 论文 成 绩 等 级 分 布 


成 绩 评 定 等 级 


CA tag—507 (59—50): , (48—50)* , (51 
ee 













全 校 成 绩 分 布 比 例 ( %) 
某 学 院 学 生 各 等 级 成 绩 人 数 


【 解 】 根据 题 意 已 知 : 

样本 总 容量 N= 二 150; 分 类 类 别 数 k 二 5; 

实际 观察 次 数 分 别 为 :fo 二 20、 fo 三 80、.fm= 二 35、fo 王 12、fo 王 3。 

虚无 假设 厅 , :该 学 院 学 生 毕 业 论 文成 绩 等 级 分 布 符合 全 校 的 分 布 模式 。 

根据 虚无 假设 和 全 校 分 布 模式 得 出 期 望 次 数 分 布 :f.1 一 15、f.2 三 ?5、f.3 二 37.5、fo 
=16.5、f.s=6。 

所 以 ,检验 统计 量 和 自由 度 分 别 为 : 





, (fo—/f):_ (20—15)*) (80—75)* , (35—37.5): 

人 EY 1 
C12—160505 36 
te 


df=k—1=5—1=4 
以 接受 虚无 假设 ,认为 该 学 院 对 学 生 毕 业 论文 的 成 绩 评定 基本 符合 全 校 的 一 般 分 布 模 
式 ,不 存在 显著 差异 。 

3. 期 户 频数 服从 菜 一 经 典 分 布 

经 典 分 布 如 正 态 分 布 , 它 的 概率 密度 曲线 已 知 ,因此 需要 时 可 以 通过 查 正 态 分 布 表 
来 确定 每 个 类 别 的 期 望 频数 。 另 外 ,前 一 节 还 提 到 ,有 时 会 根据 研究 需要 ,将 一 些 连续 变 
化 的 计量 数据 资料 转换 为 计数 资料 。 现 在 ,我 们 将 这 两 个 方面 结合 起 来 分 析 例 12 - 6 中 
的 数据 。 

[ 例 12-6]】 120 名 成 年 男子 的 体重 分 布 如 表 12 -7 所 示 ( 单 位 :kg), 且 这 一 分 布 的 
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平均 值 为 64. 21, 标 准 差 为 8. 14。 问 这 一 体重 分 布 是 否 符合 正 态 分 布 ? 
表 12-7 120 名 成 年 男子 体重 的 分 布 表 


分 组 ”45 一 50 一 55 一 60 一 65~ 70~ 75 一 ”80 一 合计 
人 数 5 9 16 35 27 13 11 41 20 


本 例 中 ,将 120 名 成 年 男子 的 体重 整理 成 频数 分 布 表 的 形式 ,体重 这 一 连续 随机 变 
量 的 计量 数据 就 转换 成 了 计数 资料 ,就 可 以 运用 x* 检验 来 考察 频数 分 布 与 正 态 分 布 之 
间 的 吻合 程度 ,以 检验 样本 所 在 的 总 体 是 否 为 正 态 总 体 ,这 一 方法 称 为 正 态 分 布 拟 合 优 
度 x 检 验 。 正 态 分 布 拟 合 优 度 检验 是 心理 学 研究 中 整理 分 析 数据 时 常用 的 统计 方法 ， 
它 与 前 面 介绍 的 适合 性 检验 的 基本 思路 是 一 致 的 ,但 在 期 望 频数 的 计算 与 自由 度 的 确定 
上 有 所 不 同 。 

正 态 分 布 拟 合 优 度 x: 检验 中 ,期望 频数 的 计算 可 以 分 为 以 下 几 个 步 又 ， 

(1) 确定 各 组 的 分 界 点 ,根据 平均 数 和 标准 差 计算 出 各 组 分 界 点 所 对 应 的 Z 分 数 ; 

(2) 从 正 态 分 布 表 中 查 出 各 个 Z 分 数 所 对 应 的 P 值 ,然后 计算 出 每 个 分 组 的 期 望 
概率 ; 

(3) 将 各 组 的 期 望 概率 乘 以 样本 容量 ,就 可 以 得 到 各 组 对 应 的 理论 期 望 频数 。 

需要 注意 的 是 ,如 果 出 现 期 望 频数 小 于 5 的 组 ,应 将 该 组 与 其 相 邻 组 合并 ,计算 出 合 
并 后 的 期 望 频数 ,如 果 还 不 到 5, 则 继续 与 相 邻 组 合并 ,直到 合并 后 的 期 望 频数 大 于 或 等 
于 5 为 止 

在 计算 期 望 频数 的 过 程 中 ,共用 到 了 总 数 、 平 均 数 .标准 差 三 个 样本 统计 量 ,所 以 正 
态 分 布 拟 合 优 度 x* 检验 的 自由 度 df=k 一 3, 其 中 ,k 为 合并 后 保留 下 来 的 组 数 。 

现在 来 解决 例 12 -6 的 数据 分 布 检验 问题 , 即 正 态 分 布 拟 合 优 度 x 检验 问题 。 

【 解 】 虚无 假设 月 。 :这 一 结果 服从 正 态 分 布 。 

计算 检验 统计 量 好 ,如 表 12 - 8 所 示 。 

表 12-8 120 名 成 年 男子 体重 频数 分 布 正 态 性 x: 值 计 算 表 








: 分 界 点 与 分 界 点 Z Ef.) 
分 组 。 所 分 办 点 对 应 之 信 ” 伯 对 应 呈 们 和 潮 记 概率 £5 < 人 
80~ 5 0.02619 3.14 
0 .4738 .01 0. 
75~ 9 A 0.06557 per BE 
75 1. 33 0. 40824 
70~ 16 0. 14709 17.65 0. 154 
70 i。 0. 26115 
65~ 35 0 0. 25716 30.86 0,555 
65 0.01 0. 00399 
一 27 0. 20246 24. 30 0. 300 
0 ”一 0.5 . 19847 
人 人 4 1 2. 846 
65 = 二 13 0. 37076 
ee 0.08918 10.70 
一 1.7: 0. 45 0.017 
45 一 4 本 C7 Sa 0. 04006 ,ei 了 
合计 120 1.00000 120 好 一 4.684 
表 12 - 8 中 数据 的 计算 过 程 是 : 


(1) 根据 已 知 条 件 知道 ,数据 被 划分 成 了 8 组 ,对 应 的 7 个 组 间 分 界 点 分 别 是 50、 
55、60、65、70、75、80, 即 表 中 第 三 列 数据 。 以 每 个 分 界 点 值 减 去 平均 数 并 除 以 标准 差 得 
到 各 分 界 点 对 应 的 Z 分 数 , 即 表 中 第 四 列 数据 ，。 

(2) 查 正 态 分 布 表 得 到 各 个 Z 分 数 对 应 的 P 值 , 即 表 中 第 五 列 数据 。 

(3) 计算 8 个 数据 组 区 间 内 对 应 的 正 态 曲 线 下 的 面积 即 概率 , 即 表 中 第 六 列 数据 。 

(4) 将 依据 正 态 分 布 计算 所 得 的 各 组 期 望 频率 乘 以 样本 总 数 120, 得 到 各 组 理论 期 
望 频数 。 因 第 一 组 和 最 后 一 组 期 望 频数 均 小 于 5, 所 以 将 这 两 个 组 频数 合并 到 其 相 邻 的 
组 中 去 ,如 表 中 第 七 列 数据 。 

(5) 因 已 知 条 件 中 给 出 了 各 组 的 观察 频数 (也 与 期 望 频数 对 应 地 合并 成 6 个 组 ), 可 
以 结合 计算 出 来 的 各 组 的 期 望 频数 求 出 x* 值 , 如 表 中 第 八 列 所 示 : 闪 一 4.684。 

再 计算 自由 度 。 因 合并 后 且 数 为 6, 所 以 该 检验 的 自由 度 为 :df 一 6 一 3 一 3。 

查 附 表 9 的 x* 值 分 布 表 , 当 df=3 时 ,xi ,一 ?7.81,X 二 4.86<7.81, 所 以 接受 虚无 
假设 ,认为 表 12 -7 中 的 数据 服从 正 态 分 布 。 


二 、 适 合 性 x? 检验 与 比率 检验 的 关系 


当 一 个 分 类 变量 为 两 个 水 平 四 
研究 对 象 划分 为 两 个 类 别 。 对 于 
析 , 也 可 以 用 x 检验 来 进 和 
例 11 -2 数据 来 分 析 说 明之 ,有 
验 结果 对 照 。 Be 

【 例 12-7】 请 运用 卡 方 检验 方法 完成 对 例 
检验 的 结果 对 照 。 

【 解 】 根据 题 意 ,已 知 :样本 容量 N=120, 其 被 分 为 不 及 格 6 人 、 及 格 114 人 两 类 。 

全 校 一 年 级 学 生 的 不 及 格 率 为 3%。 为 检验 被 分 析 学 院 的 及 格 与 不 及 格 人 数 分 布 是 
否 符 合 全 校 的 分 布 ,提出 虚无 假设 H。 :该 学 院 真实 的 不 及 格 率 与 全 校 一 年 级 学 生 的 不 及 
格 率 不 存在 显著 差异 。 

根据 虚无 假设 计算 期 望 频数 :不 及 格 的 期 望 频数 :了 .二 120X3% 二 3.6 

及 格 的 期 望 频数 :f.; = 二 120X97% 二 116. 4 

这 里 需要 注意 的 是 ;不 及 格 一 组 的 期 望 频数 未 达到 5, 所 以 要 采用 修正 公式 12-2 来 
计算 卡 方 值 ,于 是 检验 统计 量 x* 和 自由 度 计算 如 下 : 

ey 一 请 | 一 0.5) (lH Sm 0 Dy 
+= (1 和 《I5 3.6| 0.5) 


,按照 这 一 一 变量 的 水 平 可 以 将 










11 - 2 数据 的 分 析 , 并 与 第 十 一 章 比率 


十 14 一 16 4 一 0 5 一 1.034 
dF 一 2 一 1 一 1 
查 附 表 9“X 分 布 临界 值 表 ”, 当 df 一 1 时 ,好 一 3.84, 由 于 驴 一 1.034 生 3.84, 接 
受 虚无 假设 ,认为 该 学 院 学 生 的 不 及 格 率 和 全 校 一 年 级 学 生 的 不 及 格 率 不 存在 显著 性 差异 。 
对 照 第 十 一 章 例 11 -2 的 检验 结果 ,可 以 看 出 这 里 的 适合 性 x 检验 与 比率 显著 性 检 
验 所 得 统计 结论 是 一 致 的 ,而 且 这 里 的 x* 检验 计算 更 为 简便 。 
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第 三 节 独立 性 :2 检验 


研究 连续 变量 相关 关系 时 ,一 般 采用 计算 相关 系数 和 回归 分 析 的 方法 ;研究 分 类 变 
量 或 等 级 变量 如 性 格 与 血型 .对 某 一 问题 所 持 的 态度 与 性 别 等 离散 变量 之 间 是 否 相关 
时 ,通常 采用 独立 性 x* 检验 方法 。 


一 、 独 立 性 x? 检验 的 一 般 过 程 4 


独立 性 x* 检验 主要 用 于 两 个 变量 多 项 分 类 的 计数 资料 的 分 析 。 对 于 两 个 变量 多 项 分 
类 的 计数 资料 ,在 统计 整理 时 通常 将 其 编制 成 列 联 表 的 形式 。 即 把 一 个 变量 的 分 类 资料 写 
在 行内 , 另 一 个 变量 的 分 类 资料 写 在 列 内 ,用 表示 行 变量 的 分 类 项 数 ,用 。 表示 列 变量 的 
分 类 项 数 ,这 样 的 表格 在 统计 学 上 称 为 "Xe 列 联 表 。 如 在 网 12 - 2 中 ,对 某 一 问题 所 持 的 
态度 与 性 别 是 否 相关 的 研究 ,其 数据 资料 可 以 整理 成 一 个 2X3 的 列 联 表 , 如 表 12 - 2 所 示 。 

rxc 列 联 表 的 自由 度 为 dj 一 (r 一 1)(c 一 1) 。 

利用 列 联 表 提供 的 数据 ,可 以 推算 出 在 某 一 假设 条 件 下 各 个 格子 中 的 期 望 频数 。 如 
例 12 -2, 要 检验 在 态度 方面 是 否 存在 性 别 差异 ,就 要 先 提出 虚无 假设 H, :男生 与 女生 的 
态度 取向 相同 。 也 就 是 说 ,男生 与 女生 中 持 凌 成 态度 的 人 数 比率 相等 ; 持 反 对 态度 的 人 
数 比率 相等 ; 持 无 所 谓 态度 的 人 数 比 率 也 相等 。 基 于 这 样 的 虚无 假设 就 可 以 计算 各 单元 
格 中 的 期 望 人 数 。 

比如 ,计算 “男生 赞成 "这 一 单元 格 的 期 望 人 数 。 所 有 90 人 中 有 40 名 学 生 赞成 ， 


所 以 赞成 人 数 比率 为 80 , 按 男 ` 女 生 中 持 赞 成 态度 的 比率 相等 的 假设 ,就 应 该 都 是 占 甸 ， 

即 * 赞 成 "这 一 列 的 总 人 数 除 以 全 部 人 数 。 再 看 ,男生 总 人 数 为 40 人 ,所 以 男生 中 持 " 锡 

成 "态度 的 期 望 频数 /, 一 40X 名 一 17.78。 用 相同 的 方法 可 计算 出 其 他 格子 的 期 望 频数 。 
由 上 述 计算 过 程 可 以 看 出 ,一 个 单元 格 中 的 期 望 频数 可 以 用 以 下 公式 计算 ， 


和 和 天 可 咏 丰 划 盯 访 荆 区 册 二 


na, 

N 

公式 中 , 为 要 计算 的 单元 格 所 在 行 的 总 次 数 ;w 为 其 所 在 列 的 总 次 数 。 

计算 出 各 个 单元 格 的 期 望 频 数 之 后 ,再 结合 各 单元 格 的 实际 观察 次 数 ,就 可 以 计算 “ 

检验 统计 量 x 值 和 对 应 的 自由 度 了 。 经 推导 变换 ,rXc 列 联 表 的 独立 性 x 检验 可 以 采 
用 下 列 公式 直接 计算 x 值 和 自由 度 ， 


(WSR 3) 


太一 NI( 二 地 -1) (公式 12 -4) 
df=(r—1)(c—1) (公式 12 -5) 
就 刚才 讨论 的 例 12 - 2 的 问题 ,可 以 利用 上 述 方法 进行 检验 。 计 算 如 下 : 


es Eo 2 1 ， RAY 
XN(D m1) (Rm tnxn+"+nn 
df=(r—1)(c—1)=(2—1)(3—1)=2 


查 附 表 9“x 分 布 临 界 值 表 ”, 当 df 二 2 时 ,x; ws 一 5.99。 由 于 X 一 2.756 一 2， 99 , 接 
受 虚 无 假设 ,认为 学 生 在 这 一 问题 上 的 态度 与 性 别 无 关 , 即 不 存在 明显 的 性 别 差异 。 


二 、 四 格 表 的 独立 性 x? 检验 


当 调 查 只 涉及 两 个 二 分 变量 时 ,调查 结果 可 以 整理 成 四 格 表 的 形式 ， 四 格 表 的 x 
检验 在 很 多 情况 下 与 两 个 比率 的 差异 性 检验 有 着 相同 的 统计 功用 。 独立 样本 四 格 表 的 
x 检验 ,相当 于 独立 样本 比率 差异 的 显著 性 检验 ;相关 样本 四 格 表 的 x 检验 ,相当 于 相 
关 样 本 比率 差异 的 显著 性 检验 。 

四 格 表 是 最 简单 的 列 联 表 形 式 ,在 进行 统计 量 x 的 计算 和 校 下 时 , 除 可 以 运用 基本 
的 公式 12 - 1 和 公式 12-2 外 ,还 可 以 变换 出 一 些 更 简捷 的 公式 。 王 面 我 们 讨论 四 格 表 
独立 性 检验 的 方法 ,以 及 四 格 表 独立 性 检验 与 两 个 比率 差异 显著 性 检验 的 一 致 性 。 

1 . 首 立 样本 四 殖 磋 的 独立 性 +” 检验 

在 有 两 个 独立 样本 参加 研究 的 过 程 中 ,使 用 - -个 二 分 变量 将 每 个 样本 都 区 分 为 两 个 
类 别 , 由 此 统计 形成 的 2X2 的 计数 表 , 叫 做 独立 样本 四 格 表 ,这 其 中 也 因此 包含 了 两 个 
分 组 变量 。 如 表 12 -9 所 示 , 表 中 ec、d 分 别 代表 各 单元 格 对 应 的 实际 观察 次 数 。 

在 使 用 卡 方 分 布 对 两 个 分 组 变量 进行 独立 性 检验 时 ,x 值 计 算 的 简捷 公式 为 ; 

TT (公式 12 -6) 

如 果 存 在 某 一 单元 格 的 期 望 频数 小 于 5 时 ,可 使 用 的 校正 公式 为 : 

表 12-9 独立 样本 四 格 表 的 一 般 形 式 
-一 
这 













计 


N(lad 一 5 一 信 ) 

Y= TT Ta te (oa (公式 12 -7) 

【 例 12-8】 为 了 改进 体育 训练 的 方法 , 某 高 校 体育 课 教师 提出 了 一 套 新 的 体育 孝 

学 方法 。 为 了 比较 新 旧 教 学 方法 的 效果 ,随机 抽取 240 名 大 一 新 生 , 再 随机 分 为 两 组 ， 

两 组 被 试 分 别 接受 新 旧 两 种 方法 的 训练 。 学 期 结束 时 进行 相应 项 目的 达标 测试 ,测试 结 
果 汇 总 如 表 12 - 10 所 示 , 据 此 能 否认 为 两 种 训练 方法 的 效果 不 同 ? 

表 12-10 两 种 体育 教学 方法 效果 的 比较 

未 达标 达 标 

64(Ca) 56(4) 

46te) ?4(d) 


1104e 十 c) l130(atd) 


[ 解 】 由 题 意 可 知 ,本 例 属于 四 格 表 的 独立 性 卡 方 检验 , 即 通过 对 次 数 分 布 的 分 析 ， 











旧 的 训练 方法 
新 的 训练 方法 


1l20(a++b) 
li20(c+td) 
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检验 两 个 分 组 变量 是 独立 的 还 是 具有 相关 性 的 。 
虚无 假设 及, :两 个 分 组 变量 是 相互 独立 的 。 即 训 练 方法 的 不 同 不 会 引起 达标 率 的 
差异 性 。 和 
根据 公式 12 -6 计算 统计 量 卡 方 值 : 
二 N(ad— bc)’ 
% athectd at bta) 


> 240X(64X74 一 56X46): 一 5 438 
(64 十 56)(46 十 74)(64 十 46)(56 十 74) 


df=(r—1)(c—1)=]1 
查 附 表 %X 分 布 临 界 值 表 ”, 当 df=1 时 ,Xe ,一 3.84。 由 于 好 =5.438 二 3. 84 , 故 
应 拒绝 虚无 假设 ,认为 两 个 分 组 变量 具有 相关 性 ,也 即 不 同 的 训练 方法 所 产生 的 训练 效 
果 不 同 ,结合 表 12 - 10 中 的 数据 可 以 看 出 ,新 的 教学 训练 方法 效果 更 好 。 
2. 棵 关 枯 卫 四 蓓 素 的 盐 立 姓 了 7 盐 验 
如 果 参 与 研究 的 是 同一 个 样本 或 是 配对 的 两 个 两 本 ,分 别 在 两 种 不 同 的 条 件 下 接受 
观测 ,而 观测 成 绩 的 评定 又 分 为 两 个 水 平 ,那么 这 样 的 研究 就 可 以 得 到 相关 样本 四 格 表 ， 
这 里 也 存在 两 个 变量 ,进行 独立 性 卡 方 检验 时 的 类 值 计算 的 简捷 公式 为 ， 
{be 





i (公式 12 -8) 
当 某 一 单元 格 中 的 期 望 频数 小 于 5 时 ,使 用 校正 公式 计算 卡 方 值 , 即 ; 
x (公式 12 -9) 


式 中 6b.e 表示 在 相关 样本 四 格 表 中 两 次 观测 发 生变 化 的 个 案 数 或 频数 。 
【 例 12-9】 某 单 位 的 一 项 工作 改革 措施 一 公布 ,受到 50 名 员工 中 大 部 分 员工 的 反 
对 ,但 是 改革 措施 提出 者 还 是 坚持 认为 ,为 了 推进 事业 发 展 必须 推行 此 项 改革 。 为 此 他 
对 这 一 改革 措施 的 基本 依据 和 意义 进行 了 讲解 ,然后 发 现 有 一 些 员 工 的 意见 发 生 了 改 
变 。 统 计 的 结果 如 表 12 -11 所 示 。 问 前 后 两 次 评议 结果 是 否 存 在 显著 性 差异 ? 改革 措 
施 提 出 者 的 讲解 有 效 吗 ? 
表 12-11 就 改革 措施 进行 的 两 次 民主 测评 结果 





【 解 】 据 题 意 ,前 后 两 次 参与 测评 的 是 同一 个 样本 ,所 以 是 相关 样本 的 独立 性 卡 方 
检验 , 即 检验 测评 第 次 与 员工 意见 类 别 两 个 变量 之 间 是 独立 的 还 是 相关 的 。 所 以 检验 的 
虚无 假设 是 ; 

Ho :两 个 变量 是 相互 独立 的 , 即 前 后 两 次 测评 反映 出 来 的 员工 意见 没有 显著 性 差异 ， 
改革 措施 提出 者 的 解释 无 效 。 

使 用 公式 12 - 8 计算 检验 统计 量 x 值 : 


9 一 好 
X “Tc 19+5 
df=(r 一 D)(c 一 D)=1 
查 附 表 9 的 "x: 值 分 布 表 ”, 当 df 一 1 时 , 驴 s ,一 3.84。 由 于 窟 一 8.167 二 3. 84, 故 应 
拒绝 虚无 假设 ,认为 前 后 两 次 测评 结果 存在 显著 性 差异 。 结 合 表 12 - 11 的 数据 可 知 , 改 
革 措 施 提出 者 的 解释 有 效 。 因 为 第 二 次 测评 中 有 19 人 改变 了 原来 的 反对 意见 ,而 只 有 5 
人 改变 了 原来 的 赞同 意见 , 即 有 更 多 的 人 赞同 改革 措施 ，。 
在 以 四 格 表 形式 出 现 的 计数 资料 ,采用 独立 性 卡 方 检验 的 效果 与 前 一 章 介 绍 的 比率 
差异 性 检验 的 效果 是 一 致 的 。 
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第 四 节 “从 检验 的 SPSS 过 得 


现在 结合 一 些 例题 来 分 别 介绍 两 类 卡 方 检验 的 SPSS 过 程 ， 
一 、 适 合 性 x? 检验 的 SPSS 过 程 


根据 前 文 讨论 ,适合 性 检验 也 分 两 类 不 同 的 情况 :均匀 分 布 和 不 均匀 分 布 , 即 按照 某 
种 经 验 或 理论 假设 ,各 类 别 的 期 望 次 数 相等 和 不 相等 。 ; 

我 们 首先 以 隔 12 一 中 中 的 数据 来 说 明 均 匀 分 布 的 适合 性 卡 方 检验 的 SPSS 操作 过 
程 。 根据 例 12 - 1 的 题 意 ,观察 到 的 200 名 顾客 对 四 种 包装 设计 产品 的 选择 次 数 分 别 为 
42.59.48.51, 要 分 析 的 任务 就 是 看 各 种 设计 被 选择 的 人 次 分 布 在 统计 学 意义 上 是 否 相 
等 ,所 以 检验 的 虚无 假设 就 是 : 

H, :选择 各 种 包装 设计 的 顾客 人 次 数 相等 。 

根据 虚无 假设 可 以 得 到 期 望 的 人 数 分 布 :50、50、50、50, 所 以 这 一 适合 性 检验 就 是 比 
较 实 际 观察 到 的 人 次 分 布 与 期 望 分 布 的 差异 性 是 否 显 著 。 其 SPSS 过 程 是 : 

步骤 1: 建 立 数据 文件 并 作 加 权 处 理 

这 一 资料 分 析 所 需要 的 SPSS 数据 文件 比较 简单 ,其 包含 两 个 变量 和 四 个 个 案 行 ,每 
一 行 代表 了 一 个 包装 设计 类 别 , 如 图 12 - 3 所 示 。 

本 例 中 ,人 次 数 " 是 汇总 后 数据 ,所 以 要 作 加 权 处 理 。 加 权 处 理 的 方法 是 : 单 击 菜单 











图 12 -3 适合 性 卡 方 检验 的 数据 文件 示意 图 
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“Data 选择 Weight Cases… "命令 打开 对 话 框 , 勾 选 ^Weight Casesby” 激 活 对 应 的 方 框 ， 
然后 将 变量 "人 次 数 " 置 入 到 “Frequency Variable" 之 下 的 方 框 中 ,. 单 击 *“OK” 即 完成 加 权 
变量 的 设置 。 

步骤 2: 打 开 对 话 框 并 进行 相应 的 设置 

单 击 菜单 “Analyze" 选 择 “Nonparametric Test" 中 的 “Chi-square( 卡 方 )” 命 令 , 打 开 
卡 方 检验 的 对 话 握 ， 如 图 了 2 一 4 折 孙 





[ss 观 察 分 布 Lest Variable List 
|? 生机 





图 12-4 适合 性 卡 方 检验 的 对 话 框 操作 示意 图 


从 对 话 框 励 拓 的 变量 列表 中 斑 择 分 类 变革 召开 将 其 置信 "TesUVariaples 下 面 的 方 
框 中 ,本 例 中 就 是 将 类别 "变量 添加 到 这 个 方 框 中 。 勾 选 对 话 框 上 的 “All categories e- 
qual" 项 (此 选项 也 是 系统 的 默认 选项 )。 单 击 *OK" 即 可 输出 结果 ， 

步骤 3: 读 取 并 解释 结果 

此 形式 的 卡 方 检验 ,主要 输出 两 个 数据 表格 。 第 一 个 表格 输出 的 是 实际 观察 次 数 分 
布 . 期 望 次 数 分 布 ,以 及 二 者 的 差异 量 , 如 表 12- 12 所 示 。 


表 12-12 适合 性 x* 检验 的 输出 结果 (次 数 分 布 ) 


名 本 三 五 问 0D 0 盖世 咱 慰 工区 随口 


类 别 Observed N Expected N Residual 
] 42 50.0 一 8.0 
区 59 50.0 9.0 
3 48 50.0 m2, 0 
4 51 50.0 1.0 
Total 200 








第 二 个 表格 输出 的 是 卡 方 检验 的 结果 ,如 表 12 - 13 所 示 。 
表 12-13 x 检验 的 结果 


类 别 

Chi-Square 3. 000 
df 3 

Asymp. Sig. .392 





表 12 -12 和 表 12-13 显示 的 结果 说 明 , 本 例 中 的 人 次 数 分 布 虽 然 存在 一 些 差异 性 ， 
但 是 这 种 差异 性 未 达到 显著 性 水 平 (好 一 3.00,b 一 0. 392 二 0. 05) ,所 以 可 以 认为 顾客 对 
各 种 包装 设计 产品 的 选择 未 表现 出 特别 的 偏好 。 

现在 再 以 例 12 -5 中 的 数据 为 例 来 介绍 不 均匀 分 布 的 适合 性 检验 过 程 。 

步骤 1: 建立 数据 文件 并 作 加 权 处 理 

根据 例 12 -5 中 的 已 知 信息 ,该 数据 文件 包含 两 个 变量 :成绩 等 级 ,观察 到 的 某 学 院 
学 生 的 成 绩 等 级 分 布 , 建 立 SPSS 数据 如 图 12 -5 所 示 。 





图 12-~<5 适合 性 卡 方 检验 的 数据 文件 示意 图 


本 例 中 性 观察 分 布 " 已 经 是 汇总 后 次 数 , 所 以 要 作 加 权 处 理 。 单 击 菜单 “Data "选择 
“Weight Cases*…” 命 令 打 开 对 话 框 , 勾 选 “Weight Casesby” 激 活 对 应 的 方 框 ,然后 将 变量 
“观察 分 布 "置信 到 “Frequency Variable" 之 下 的 方 框 中 , 单 击 “OK" 即 完成 加 权 变 量 的 
设置 。 

步骤 2: 打 开 对 话 框 并 进行 相应 的 设置 

单 击 菜单 “Analyze” 选 择 “Nonparametric Test” 中 的 “Chi-square( 卡 方 )” 命 令 , 打 开 

长 方 检验 的 对 话 框 , 如 图 12 -6 所 示 。 





图 12-6 适合 性 卡 方 检验 的 对 话 框 操作 示意 图 
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LL 得 半 太 0 了 0J 灯 站 于 莹 阳 忆 





从 对 话 框 左边 的 变量 列表 中 选择 分 类 变量 名 并 将 其 置 人 "Test Variables" 下 面 的 方 
框 中 ,本 例 中 就 是 将 "等 级 "变量 添加 到 这 个 方 框 中 。 设 置 期 望 的 次 数 分 布 模式 ; 勾 选 对 
话 框 上 的 “Values" 项 ,激活 其 后 边 的 方 框 ,然后 填写 10, 单 击 "*Add” 使 其 添加 到 方 框 中 ， 
接着 按照 同样 的 方法 将 期 望 分 布 的 比例 数 50.25.11.4 也 依次 添加 到 方 框 中 ,如 图 12 -6 
所 示 。 单 击 “OK” 即 可 输出 结果 。 

步骤 3: 读 取 并 解释 结果 

此 一 形式 的 卡 方 检验 ,也 主要 是 输出 两 个 数据 表格 。 第 一 个 表格 输出 的 是 实际 观察 
次 数 分 布 ,期望 次 数 分 布 ,以 及 二 者 的 差异 量 , 如 表 12 - 14 所 示 。 


表 12-14 适合 性 x 检验 的 输出 结果 (次 数 分 布 ) 


类 别 Observed N Expected N Residual 
1 20 15.0 5.0 
2 80 75.0 FO 
3 35 37.5 一 和 与 
4 12 16.5， aa 
5 3 6.0 -3 
Total 150 





第 二 个 表格 输出 的 是 卡 方 检验 的 结果 ,如 表 12- 15 所 示 。 
表 12-15 ww 检验 的 结果 


类 别 

Chi-Square 4. 894 
df 4 

Asymp. Sig. .298 


表 12-14 和 表 12-15 显示 的 结果 说 明 , 本 例 中 某 学 院 学 生 的 成 绩 等 级 分 布 与 全 校 
的 成 绩 等 级 分 布 没 有 达到 显著 性 差异 (x: 二 4. 894, pp 二 0.298 守 0.05), 所 以 可 以 认为 该 学 
院 对 学 生 毕 业 论 文 评定 的 成 绩 分 布 符合 全 校 的 一 般 等 级 分 布 情况 。 


二 、 独 立 性 x? 检验 的 SPSS 过 程 0 ee 


"Xe 列 联 表 的 独立 性 x? 检验 可 以 调用 “Crosstabs” (交叉 列 联 ) 过 程 来 完成 。 
Crosstabs 过 程 为 二 因素 表格 提供 了 数 种 检验 和 关联 测量 。 

现在 ,我 们 以 例 12 -2 中 的 数据 来 说 明 Crosstabs 的 卡 方 检验 功能 。 其 一 般 过 程 是 : 

步骤 1 :建立 数据 文件 并 作 加 权 处 理 

根据 例 12 -2 目的 已 知 信息 ,该 数据 文件 包含 三 个 变量 :被 试 性 别 、 态 度 取向 .汇总 的 
人 次 数 ,建立 SPSS 数据 如 图 12 -7 所 示 。 

本 例 中 ,“ 人 次 数 " 已 经 是 汇总 后 次 数 , 所 以 要 作 加 权 处 理 。 单 击 菜单 “Data” 选 择 
“Weight Cases… ”命令 打开 对 话 框 , 勾 选 “Weight Casesby” 激 活 对 应 的 方 框 ,然后 将 变 
量 " 人 次 数 " 置 入 到 “Frequency Variable" 之 下 的 方 框 中 , 单 击 "OK” 即 完成 加 权 变 量 的 








图 12-7 独立 性 卡 方 检验 的 数据 文件 示意 图 
设置 。 
步骤 2: 打 开 对 话 框 并 进行 相应 的 设置 
单 击 菜单 “Analyze” 选 择 “Descriptive statistics” 中 的 “Crosstabs…” 命 令 , 打 开交 叉 
列 联 分析 的 主 对 话 框 ,如 图 12-8 所 示 。 


性别 
CD] 
Column{s}: 


DJ 允 坊 故 





图 12-8 Crosstabs 分 析 主 对 话 框 


从 对 话 框 左边 的 变量 列表 中 选择 分 类 变量 “性别 " 团 人 到 "Rows" 下 边 的 变量 框 中 ， 
选择 分 类 变量 “态度 " 置 人 到 "Columns”" 下 边 的 变量 框 中 ,如 图 12 -8 所 示 。 

单 击 主 对 话 框 上 的 “Statistics…” 打 开 如 图 12 -9 所 示 的 对 话 框 ,在 此 对 话 框 上 勾 选 
“Chi-square”( 卡 方 ) ,然后 单 击 “Continue” 按 钮 返回 主 对 话 框 。 

单 击 主 对话 框 上 的 "OK" 按钮 输出 分 析 结 果 。 

步骤 3: 读 取 并 解释 结 

此 一 形式 的 卡 方 检验 ,主要 的 输出 结果 如 表 12- 16 所 示 ， 
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F Chisquare 

Contingency coefficient FT Gamma 

厂 Phi and Cramér's V 厂 Somers' d 

TT Lambda Fm Kendall's tau-b 

| TT Uncertainty coefficient We Kendall's tau-c > 
_ Nominal by Interval 

TEm 


厂 Cochran's and Mantel-Hacnszel statistics 


Eesti commoan odds ra equale; 





图 12-9 Crosstabs 分 析 之 设置 卡 方 检验 对 话 椎 


表 12-6 独立 性 x 检验 绪 果 (Chi-Square Tests) 








Value df Asymp. Sig. (2-sided) 
Pearson Chi-Square 2.756 2 . 252 
Likelihood Ratio 2.813 2 .245 
Linear-by-Linear Association 2. 692 101 
N of Valid Cases 90 





表 12-16 显示 的 结果 说 明 , 本 例 中 男女 生 对 高 考 改革 新 模式 的 态度 未 达到 显著 性 的 
性 别 差异 (x: ==2. 756,p=0. 252 二 0. 05) 。 


和 一 一 一 坚 习 思考 与 练习 题 一 jp 


1. 心理 学 研究 中 的 计数 资料 是 如 何 获 得 的 ?计数 数据 与 计量 数据 有 哪些 区 别 和 
联系 ? 

2. 常用 的 计数 数据 的 统计 分 析 方 法 有 哪些 ? 

3. 比率 的 显著 性 检验 与 卡 方 检验 有 哪些 区 别 和 联系 ? 

4. 某 商 场 想 了 解 一 下 顾客 对 三 种 品牌 的 矿泉 水 的 言 好 程度 ,以 便 为 下 一 次 进货 提供 
决策 依据 。 随 机 观察 150 名 购买 者 ,并 记录 下 他 们 所 选 购 的 品牌 ,统计 出 三 种 品牌 购买 
的 人 数 , 如 表 12 -17 所 示 。 这 些 数 据 是 否 可 以 说 明 顾 客 对 这 三 种 矿泉 水 的 喜好 度 存在 差 
异 ? 


一 一 一 0608@ 村 总 m om 朵 悚 了 于 葵 痪 呈 


表 12-17 三 种 品牌 的 选 购 人 数 
品牌 甲 忆 两 合计 


人 数 61 53 36 150 





5. 某 地 区 是 苗族 .瑶族 .侗族 ,布依 族 等 多 个 少数 民族 事 居 区 。 随 机 抽取 200 人 ,其 
中 各 个 民族 所 占 的 人 数 如 表 12 -18 所 示 。 请问; 这 些 数 据 能 否 说 明 该 地 区 各 个 少数 民族 
的 人 口 数 存在 显著 差异 ? 





wm 66 “9 人 全 


表 12-18 样本 中 各 少数 民族 的 人 数 
人 数 60 55 45 40 200 


6. 学 校 要 求 各 院 系 在 本 科 生 毕业 设计 的 成 绩 评定 中 ,要 注意 成 绩 等 级 的 人 数 分 布 ， 
一 般 应 符合 表 12 - 19 中 第 一 行 数 据 所 示 的 比例 。 某 院 65 名 本 科 生 毕业 设计 成 绩 等 级 分 
布 如 表 12 -19 中 的 第 二 行 数字 所 示 。 请 问 : 该 院 系 学 生 毕 业 设 计 的 成 绩 评定 是 否 符合 学 
校 要 求 ? 





表 12-19 毕业 论文 各 等 级 比例 要 求 和 某 学 院 各 等 级 人 数 


te rts ye shade dei i 
评定 等 级 优 良 中 及 格 或 不 及 格 合计 
要 求 比例 10% 50% 30% 10% 100% 
某 院 各 等 级 人 数 8 42 12 3 65 SS 
Ge 


验 表 12 - 20 中 数学 成 绩 的 频数 分 布 是 否 符 合 正 态 分 布 。 
表 12-20 数学 成 绩 的 次 数 分 布 表 
分 组 45~ 50~ 55~, 60~ 65~ 70~ 75~ 80 一 85~ 90~ 合计 
频数 4 9 一 和 6 4 I: -1 局 








第 
十 
8. 在 一 次 就 一 项 重大 决策 的 表决 中 ,民主 党 与 共和 党 人 士 的 态度 如 表 12 - 21 所 示 。 齐 
请 问 : 在 有 关 此 项 决策 的 态度 上 ,两 党 派 是 否 存在 显著 差异 。 卡 
表 12-21 两 党 派 人 士 对 该 项 决策 的 不 同 态度 的 人 数 分 布 ~ 
态度 取向 
间 记 反对 ， 未 家 而 ” -= 
民主 党 85 78 37 200 - 
共和 党 116 59 25 200 和 
合计 201 137 62 400 


9. 表 12 - 22 中 数据 是 120 名 学 生 的 期 中 与 期 末 英 语 考试 成 绩 。 请 问 这 两 次 考试 的 
及 格 率 是 否 有 显著 性 的 差异 。 


表 12-22 学 生 期 中 与 期 末 考 试 成 绩 分 布 





期 未 考试 
i 
及 格 不 及 格 合计 
期 中 考试 及 格 61 15 76 国 
不 及 格 33 | 44 
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第 十 三 章 非 参数 检验 
(Gas 








参数 检验 一 般 要 求 数据 总 体 呈 正 态 分 布 或 近似 于 正 态 分 布 , 还 常常 要求 作 差 异性 比 
较 的 独立 组 之 间 方 差 齐 性 。 但 有 时 这 些 条 件 不 能 满足 ,就 需要 非 参 数 检 验 。 非 参数 检验 
是 相对 于 + 检验 ,Z 检验 和 下 检验 等 参数 检验 方法 而 言 的 ,对 数据 样本 要 求 较 低 , 适 用 于 
计数 资料 ,等 级 资料 和 一 些 偏 态 分 布 的 资料 。 本 章 只 介绍 四 种 常用 .简单 的 非 参 数 检验 
方法 :符号 检验 、 符 号 秩 次 检验 、 秩 和 检验 、 中 位 数 检验 。 其 中 前 两 种 适用 于 相关 样本 的 
资料 ,后 两 种 适用 于 独立 样本 的 资料 。 





统计 推断 中 计 基 资料 的 上 检验 .Z 检验 和 下 检验 ,几乎 都 是 基于 总 体 正 态 分 布 ,总体 
方差 齐 性 条 件 下 的 对 总 体 参 数 的 检验 ,所 以 称 为 参数 检验 (parametric test)。 但 是 当 总 
体 分 布 未 知 或 已 知 总 体 分 布 与 检验 所 要 求 的 条 件 不 符 ,或 者 虽 经 数据 转换 仍然 不 能 满足 
参数 检验 条 件 时 ,就 需要 一 些 不 依赖 于 总 体 分 布 . 与 总 体 参 数 无 关 的 检验 方法 了 。 该 方 
法 不 受 总 体 参 数 的 影响 , 且 检 验 的 是 分 布 ,而 不 是 参数 ,所 以 称 为 非 参数 检验 (nonpara- 


mietric test) 。 


第 一 节 非 参数 检验 概述 


非 参数 检验 方法 在 处 理 资料 时 所 比较 的 是 分 布 而 不 是 参数 。 它 不 考虑 资料 总 体 的 
分 布 形态 ,直接 用 样本 数据 的 符号 .大 小 顺序 码 ,综合 判断 划分 的 名 次 、 严 重 程 度 、 优 劣 等 
级 等 作 比 较 ; 检 验 时 不 对 总 体 分 布 作假 设 ,或 者 只 作 一 些 诸如 对 称 性 之 类 的 简单 假设 。 
在 总 体 分 布 未 知 的 情况 下 ,可 以 把 数据 按 大 小 排队 ,使 每 个 数据 都 有 自己 的 “地 位 ”, 统 计 
学 称 之 为 秩 (rank) ,大 小 为 n 的 样本 也 就 产生 了 n 个 秩 。 这 样 ,问题 就 简化 为 对 这 些 秩 的 
研究 了 。 这 些 秩 及 由 其 产生 的 统计 其 的 性 质 和 分 布 与 原来 的 总 体 分 布 无 甘 , 所 以 也 叫做 
自由 分 布 (distribution-free)。 除 了 与 我 有 关 的 方法 外 ,本 章 还 会 介绍 一 些 其 他 的 非 参 数 
检验 方法 。 需 要 注意 的 是 :参数 检验 与 非 参数 检验 之 间 的 界线 并 非 泾 渭 分 明 , 有 些 统计 
问题 , 既 可 以 理解 为 参数 性 的 ,也 可 以 理解 为 非 参 数 性 的 ， 


一 、 非 参数 检验 的 适用 范围 
非 参 数 检验 常用 于 下 述 资料 的 分 析 : 










(1) 顺序 变量 .等 级 


(4) 分 组 资料 的 同 质 性 较 差 : 要 比较 的 各 组 资料 变异 性 相差 较 大 ,其 方差 不 齐 , 且 不 
易 变 换 达 到 齐 性 , 宜 选 用 非 参 数 检验 。 

(5) 资料 的 初步 分 析 : 当 需要 迅速 得 到 结果 时 ,也 可 以 用 非 参 数 检验 方法 进行 初步 
分 析 ,然后 再 挑选 其 中 更 有 意义 的 部 分 做 进一步 分 析 ,包括 进 一 步 的 参数 分 析 。 

非 参 数 检验 依然 遵循 假设 检验 的 基本 思想 和 准则 ,在 缺乏 总 体 分 布 信息 的 情况 下 ， 
利用 统计 思想 .数学 方法 和 技巧 构造 相应 的 统计 量 ,检验 数据 资料 是 否 来 自 同一 个 总 体 ， 


二 、 非 参数 检验 的 优 缺 点 


和 参数 检验 相 比 , 非 参数 检验 有 以 下 优点 ， 

(1) 一 般 不 需要 严格 的 假设 前 提 。 可 用 来 分 析 由 等 级 构成 的 数据 资料 ,要 求 资料 的 
计量 水 平 较 低 ,因而 适用 的 范围 也 比较 广泛 ,这 是 它 与 参数 检验 相 比 的 最 大 优点 . 

(2) 稳定 性 。 因 为 对 总 体 分 布 的 条 件 约束 大 大 放宽 ,所 以 一 般 不 需要 对 总 体 作 过 于 
理想 化 的 假设 而 使 之 脱离 研究 实际 :对 个 别 较 大 的 偏离 数据 也 不 会 太 敏 感 ， 

(3) 运算 比较 简单 。 不 需要 太 多 的 数学 基础 和 统计 学 知识 ,可 以 迅速 完成 运算 , 比 
较 节约 时 间 。 

(4) 很 适用 于 小 样本 、 无 分 布 样本 .数据 污染 样本 、 混 杂 样 本 等 , 且 方 法 简单 。 心 理 
学 研究 中 ,在 进行 一 些 规模 较 大 、 设 计 复杂 的 实验 之 前 ,往往 需要 预 实验 , 预 实验 的 被 斌 
数 较 少 , 又 需要 对 资料 作 快速 处 理 ,这 时 非 参 数 检验 

但 非 参数 检验 方法 也 有 以 下 缺点 : 

(1) 最 大 不 足 是 未 能 充分 利用 资料 的 全 部 信息 “由 于 方法 简单 ,使 用 的 计量 水 平 较 
低 ,未 能 充分 地 使 用 数据 中 的 信息 ,对 个 别 数据 的 变化 也 不 敏感 。 所 以 ,为 追求 简单 而 使 
用 非 参数 检验 方法 时 ,其 检验 功效 要 差 些 在 给 定 的 显著 性 水 平 下 进行 检验 时 ,与 参数 
检验 方法 相 比 , 非 参 数 检验 过 程 中 的 1 类 错误 的 概率 8 要 大 些 。 

(2) 对 于 大 样本 资料 ,如 不 采用 适当 的 近似 计算 ,会 使 运算 变 得 十 分 庞杂 。 

(3) 目前 ,还 不 能 处 理 变量 间 的 “交互 作用 ”。 









第 二 节 符号 检验 


符号 检验 (Sign Test ) 是 利用 正 、 负 号 的 数目 对 某 种 假设 作出 判定 的 非 参 数 检验 方法 。 
一 、 符 号 检验 的 基本 原理 


在 比较 两 个 有 相关 的 样本 之 差异 时 ,如 果 样 本 数据 来 自 于 顺序 量 表 , 无 法 采用 配对 样 
本 的 + 检验 , 则 可 以 采用 符号 检验 。 它 与 参数 检验 中 配对 样本 差异 显著 性 的 + 检验 相对 应 ， 


测量 资料 : 即 按 某 种 属性 的 不 同 程度 将 观察 单位 分 组 计 
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是 根据 两 个 配对 样本 的 每 对 数据 之 差 的 符号 ( 正 号 或 负 号 进行 的 样本 差异 显著 性 检验 。 

符号 检验 法 也 是 将 中 数 作为 集中 趋势 的 量度 ,虚无 假设 是 配对 样本 资料 差 值 来 自 中 
位 数 为 零 的 总 体 。 它 是 将 两 样本 的 每 对 数据 之 差 (X, 一 Y) 用 正 负 号 表示 , 若 两 样本 没有 
显著 性 差异 , 则 正 差 值 与 负 差 值 应 大 致 各 占 一 半 ， 

其 基本 原理 是 :不 能 确定 总 体 是 否 为 正 态 分 布 时 ,检验 同一 组 被 试 在 实验 处 理 前 后 
分 别 接受 同样 的 测试 得 到 两 组 数据 ,或 者 配对 的 两 组 被 试 直接 接受 测试 与 实验 处 理 后 的 
测试 分 别 得 到 的 两 组 数据 之 间 是 否 存 在 差异 时 ,可 以 使 用 符号 检验 。 具 体 做 法 是 :用 第 
二 组 数据 减 去 对 应 的 第 一 组 数据 ,得 正 数 记 为 正 号 ;得 负数 记 为 负 号 ,然后 作 单 样 本 的 二 
项 分 布 检验 , 即 可 判断 正 负 号 数 是 否 存在 显著 性 差异 。 


二 、 符 号 检验 的 基本 步骤 


1. 元 出 庶 无 假设 与 研究 假设 

虚无 假设 Ho: 甲 , 乙 两 处 理 差 值 d 总 体 中 位 数 为 0; 

研究 假设 电 , :甲乙 两 处 理 差 值 d 总体 中 位 数 关 0。 

此 时 进行 双 侧 检验 。 若 将 万 , 中 的 * 关 ” 改 为 "二 "或 “二 ”, 则 进行 单 侧 检 验 。 

2. 计算 汰 价 江 峰 予 入 号 

计算 甲乙 两 个 处 理 的 配对 数据 的 差 值 4;d 二 0 则 记 为 “十 ”;d 一 0 则 记 为 “一 ”;d 二 0 
记 为 “0”。 统 计 “ 十 ”“ 一 ”“0” 的 个 数 ,分 别 记 为 n, 、n_ .mo3 令 N=n, 十 n_ ,检验 的 统计 
基 为 上 ,等 于 .n_ 中 的 较 小 者 , 即 上 =min(n, ,n_ )。 

3. 统计 次 启 

由 NN 查 附 表 10* 符 号 检验 表 ”, 得 临界 值 &o_oscwy 或 ocn,。 如 果 7 二 oscnw ; 则 pp 二 0. 
05, 不 能 拒绝 虚无 假设 Ho, 两 个 实验 处 理 所 得 结果 差异 不 显著 ; 如果 后 ww 二 上 三 
koosew ; 则 0.01 二 p 王 0.05, 可 在 0. 05 显著 性 水 平 上 否定 虚无 假设 Ho, 接受 研究 假设 
Ha ,两 个 实验 处 理 差 异 显著 ;如 果 k 筷 win , 则 pp 二 0.01, 在 0.01 显著 性 水 平 上 拒绝 虚 
无 假设 Ho ,接受 研究 假设 H ,两 个 实验 处 理 所 得 结果 的 差异 很 显著 (注意 ; 当 上 恰好 等 
于 临界 值 时 ,其 确切 概率 常 小 于 附 表 10 中 列 出 的 相应 概率 ) 。 

【 例 13- 1 某 研究 者 测定 了 噪声 刺激 前 后 15 名 成 人 被 试 的 心率 变化 ,结果 如 表 
13 -1 所 示 。 请 问 :噪声 对 这 些 被 试 的 心率 有 无 显著 影响 ? 


表 13-1 噪声 刺激 前 后 被 试 的 心率 (次 /分 钟 ) 
锌 这 号 1 2 3 4 5 6 了 8 WD /人 人间 汪汪 


S$ 生生 H 加 WnDnT 帐 闻 洲 岗 忆 





刺激 前 ”61 70 68 73 85 81 65 62 72 B84 ?6 50 80 79 71 
刺激 后 75 79 85 77 84 87 88 76 74 81 85 78 88 80 84 
益 值 一 1 一 9 一 17 一 4 ] = i = 3 so Te ep pa 
符 号 一 - — + -一 下 -” - 





【 解 】 这 是 一 个 配对 资料 的 双 侧 检验 问题 。 如 果 采 用 符号 检验 , 则 其 检验 步骤 是 ， 
1. 规 出 虚无 假设 与 研究 假设 : 

虚无 假设 Ho: 噪 声 刺 激 前 后 被 试 的 心率 差 值 d 总 体 中 位 数 二 0; 国 
研究 假设 H, :噪声 刺激 前 后 被 试 的 心率 差 值 d 总 体 中 位 数 去 0。 








2 . 计算 考 侧 漠 司 巴 秆 号 : 

经 过 计算 ,噪声 刺激 前 后 的 差 值 及 符号 列 于 表 13 - 1 中 的 第 4 行 和 第 5 行 ,从 而 得 到 
1 一 2 一 13, N=n 十 n- 一 2 十 13 王 15, 人 一 min(2 + ,1- ) 一 1 一 2。 

3. 统计 从 上 断 : 

当 ?=15 时 , 查 附 表 10 得 临界 值 &.002s 二 2, 所 以 上 二 2 二 ko02z yp 一 0.02, 表 明 噪 声 
刺激 对 被 试 的 心率 影响 基本 上 达到 了 0.02 的 显著 性 水 平 。 

在 附 表 10 中 ,虽然 N 是 从 1 至 90, 就 是 说 N 在 这 个 范围 内 时 都 可 以 查 附 表 10, 但 
是 在 实际 研究 中 , 当 mn 二 25 时 常 近似 使 用 正 态 分 布 完成 检验 

将 N 分 成 nn; 和 7 两 部 分 ,m+ 或 服从 二 项 分 布 , 当 N 二 25 时 ,可 将 二 项 分 布 近似 
看 成 正 态 分 布 , 则 : 





【公式 135 1 


因为 二 项 分 布 是 间断 性 变量 的 概率 分 布 , 而 正 态 分 布 是 连续 变量 的 概率 分 布 ,所 以 
要 使 用 正 态 分 布 来 分 析 二 项 分 布 的 资料 时 ,最 好 使 用 连续 性 校正 后 的 公式 来 计算 Z 值 , 即 : 
(k 士 0.5) 一 全 


二 (公式 13 - 2) 
VN 


2 
当今 时 , 式 中 括号 内 要 用 人 一 0.5; 当 人 一 人 时 ,括号 内 要 用 k 十 0 5。 而 前 面 曾 规定 和 


为 nt 和 -中 较 小 的 一 个 ,必然 有 k 一 人 ,所 以 使 用 公式 13-2 时 ,括号 内 应 为 十 0. 5。 





需要 注意 的 是 :虽然 符号 检验 较 简 单 ,但 是 由 于 利用 的 信息 较 少 ,所 以 效率 较 低 。 在 
样本 的 配对 数 少 于 6 时 ,此 方法 几乎 无 效 , 不 能 使 用 :在 样本 配对 数 为 7 一 12 时 ,此 方法 
也 不 敏感 ,但 可 以 使 用 ;样本 配对 数 在 20 以 上 时 ,符号 检验 就 较为 有 效 。 











第 三 节 符号 秩 次 检验 


符号 检验 会 丢失 很 多 信息 ,因为 它 只 利 骨 了 每 对 数据 差 值 的 正 负 号 。 为 此 , 威 尔 克 
松 (F。Wilcoxon) 提 出 了 既 考 虑 差 值 正 负 号 ,又 考 虚 差 值 大 小 的 符号 秩 次 检验 方法 。 符 
号 秩 次 检验 又 称 为 符号 等 级 检验 (signed rank test) ,符号 秩 和 检验 (signed rank-sum 
test) 等 ,是 一 种 经 过 改进 的 符号 检验 ,有 时 也 称 为 威 尔 克 松 检 验 法 (Wilcoxontest)。 


一 、 符 号 秩 次 检验 的 基本 原理 


符号 秩 次 检验 的 适用 条 件 与 符号 检验 法 相同 ,也 适合 于 配对 比较 ,但 它 的 精确 度 好 
于 符号 检验 方法 。 因 为 它 除了 比较 各 对 数据 的 差 值 符号 外 ,还 要 比较 各 对 数据 差 值 大 小 


99 和 生计 扎 入 避 虞 山川 十 器 
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的 秩 次 高 低 。 

其 基本 原理 是 :首先 求 出 每 一 对 数据 的 差 值 4, 车 d=0 则 剔除 该 对 数据 ;接着 对 各 个 
差 值 取 绝 对 值 , 并 将 所 有 差 值 的 绝对 值 按 从 小 到 大 的 顺序 编排 并 赋予 其 高 低 等 次 , 即 秩 
次 ;最 后 ,将 各 个 差 值 的 正 负 号 标 在 该 差 值 对 应 的 秩 次 前 。 这 样 , 秩 次 就 有 了 正 秩 和 人 负 秩 
之 分 。 显 然 , 当 两 个 样本 没有 显著 差异 时 , 正 秩 和 与 负 秩 和 应 大 致 相等 。 

于 是 ,符号 秩 次 检验 的 虚无 假设 就 是 有 H,: 差 值 4 总 体 的 中 位 数 =0。 


二 、 符 号 秩 次 检验 的 基本 步骤 


1. 起 内 唐 无 假设 与 钱 究 假设 

虚无 假设 日,,: 差 值 d 总 体 的 中 位 数 二 0; 

研究 假设 晶 ,: 差 值 d 总 体 的 中 位 数 隆 0。 

此 时 进行 双 侧 检验 。 若 将 态 , 中 的 * 隆 " 改 为 “二 "或 “二”, 则 进行 单 侧 检 验 。 

2. 答 税 次 与 定 父 号 

先 计算 配对 数据 的 差 值 4, 然 后 按 d 的 绝对 值 从 小 到 大 编排 秩 次 (注意 : 差 值 为 零 的 
不 参加 秩 次 编排 和 计算 ), 再 根据 原 差 值 正 负 在 各 秩 次 前 标 上 正 负 号 。 若 差 值 4==0, 则 使 
去 不 记 , 样 本 数 相应 地 减 去 d= 二 0 的 个 案 数 后 记 为 N; 车 有 若干 个 差 值 d 的 绝对 值 相等 ， 
车 正 负 号 一 致 , 则 按 顺 序 编 秩 即 可 ,车 有 符号 不 同 者 , 则 应 取 平 均 秩 次 。 编 秩 后 , 按 差 值 的 正 
负 号 给 秩 次 添上 符号 。 

3. 物 定 趁 验 统计 量 厂 

分 别 计算 正 秩 次 及 负 秩 次 的 和 , 正 秩 次 和 用 T, 表示 , 负 秩 次 和 的 绝对 值 用 了 _ 表示 。 
T, 与 之 和 应 该 正好 等 于 N(N 十 1)/2, 所 以 此 式 可 验证 T, 和 T- 的 计算 是 否 正 确 , 并 
以 绝对 值 较 小 的 秩 和 绝对 值 为 检验 的 统计 量 T。 

4. 统计 挫 扬 f 

将 正 , 负 差 值 的 总 个 数 记 为 N, 根 据 N 查 附 表 11* 符 号 秩 次 检验 表 ” 得 到 临界 值 TT ocw， 
或 Tiokwmw。 如 果 本 二 Toowmw bp 二 0.05, 则 不 能 拒绝 虚无 假设 Hi,, 两 个 实验 处 理 的 差异 
黄 不 显著 ;如 果 Thotw<sTsTowy0.01 一 pp 二 0.05, 则 在 0. 05 显著 性 水 平 上 拒绝 虚无 
假设 Ho ,接受 研究 假设 H ,两 个 实验 处 理 之 间 的 差异 显著 ;如 果 T 近 Th ww ,pp 过 0. 01， 
则 可 在 0.01 显著 性 水 平 上 拒绝 虚无 假设 HH ,接受 研究 日 , ,两 个 实验 处 理 的 差异 达到 很 显 
著 的 水 平 (注意 : 当 了 恰好 等 于 临界 工 值 时 ,其 确切 概率 常 小 于 附 表 11 中 列 出 的 相应 概率 ) 。 

【 例 13-2】 经 配对 的 两 个 学 生 样 本 分 别 参加 两 种 条 件 下 的 某 项 测试 ,测试 结果 如 
表 13 -2 所 示 ,请 用 符号 秩 次 检验 方法 检验 两 个 组 成 绩 的 差异 是 否 显著 。 

表 13-2 两 个 配对 样本 测试 的 成 绩 

次 教 1 名 证 和 

组 ! 81 100 94 75 82 100 98 84 100 66 97 87 86 99 80 9 

组 2 和 100 8 78 4 099 扎 98 83 7 WO 79 89 Wh 


d ?7 | 2 10 0 13 I 0 5 一 


dj 7 0 | 3 l2 10 l 一 2 i， 测 13 WE a 3 
符号 十 一 一 = + 十 十 一 P40 一 
TT 


【 解 】 两 个 数据 样本 为 相关 样本 ,使 用 符号 秩 次 检验 的 过 程 如 下 : 

1. 建立 雇 无 假设 和 研究 段 设 : 

虚无 假设 Hw: 差 值 d 总 体 的 中 位 数 三 0; 

”研究 假设 Ha: 差 值 d 总 体 的 中 位 数 关 0。 

2. 综 敌 次 与 定 伦 号 : 

使 用 每 一 配对 数据 中 组 一 中 的 数 减 去 组 二 中 的 数 ,得 到 二 者 的 差 值 4, 取 d 的 绝对 值 
并 记录 对 应 的 符号 ,如 表 13 -2 所 示 。 将 d 按照 绝对 值 从 小 到 大 的 顺序 排列 : 

一 5 二 2 一 3 一 9 一 4 一 5 二 1 了 lo 一 一 二, 一] 一 功 

于 是 得 到 它们 的 秩 次 为 ， 

一 1, 十 2, 一 3,5, 一 3.5, 一 5, 一 6, 十 7, 十 8.5, 十 8.5, 一 10, 一 11, 一 12, 十 13 

其 中 ; 正 的 秩 次 和 :T, 三 39; 负 的 秩 次 和 ;TT_ 一 52 

所 以 ,T=T,==39 

查 附 表 11” 符号 秩 次 检验 表 ” 得 到 : 当 N=13 时 To 2 一 17,T 一 39 二 To ,两 个 相 
关 的 数据 样本 未 达到 显著 性 的 差异 。 

另外 ,与 符号 检验 同样 的 道理 , 当 N 二 25 时 ,T 的 分 布 接近 于 正 态 分 布 ,可 以 使 用 正 
态 分 布 进行 差异 性 检验 , 即 ， 


m= (公式 13 -3) 


加 EECEEEREE 人 AR 
因而 ,检验 的 统计 量 Z 值 计算 公式 为 : 
pin 4 (公式 13 =5) 


or 
当 出 现 相同 秩 次 较 多 时 ,应 计算 校正 统计 量 Z.: 
> | T—n(n+1)/4 | 一 0.5 
nnt DC2n+1)—0,5D) 0 — 41)]/24 
式 中 , 心 为 第 &A(k 一 1,2,…) 个 相同 差 值 的 个 数 ,假定 差 值 中 有 2 个 0.1,3 个 0.2,5 个 
0.3, 则 和 一 2, 和 三 3 一 5，》 (让 一 丰 ) = (2 三 轨 寺 (3 二 3 二 (051 一 5) = 150。 
需要 说 明 的 是 :同一 个 问题 既 用 符号 检验 又 用 符号 秩 次 检验 时 ,有 可 能 出 现 矛 盾 的 
结果 ,这 时 应 该 以 符号 秩 次 检验 的 结果 为 准 。 因 为 符号 检验 只 考虑 对 应 数据 差 值 d 的 符 
号 ,忽略 其 差异 量 的 大 小 ,丢失 了 一 部 分 信息 。 而 符号 秩 次 检验 同时 考虑 了 d 的 大 小 (对 
其 大 小 进行 秩 次 编排 ) ,利用 了 更 多 的 信息 ,所 得 结果 的 可 靠 性 相对 更 高 。 
符号 检验 和 符号 秩 次 检验 都 是 针对 连续 性 数据 或 者 有 序 分 类 数据 , 若 要 检验 每 一 对 
二 分 变量 之 间 的 差异 是 否 显 著 , 则 应 使 用 麦克 内 玛 检验 (MecNemar test)。 


se 和 生计 芳 泛 办 并 髓 | 十 济 


(公式 13 -6) 


第 四 节 秩 和 检验 


秩 和 (the sum of ranks) 即 秋 次 的 和 ,也 就 是 等 级 之 和 。 这 一 方法 首先 由 威 尔 克 松 提 





#9 关闭 加 mom DWT 相生 浸 疯 车 





出 ,后 来 由 曼 一 惠 特 尼 (Mann-Whitney) 将 其 应 用 到 两 样本 容量 不 等 的 情况 ,因而 又 称 做 
电 一 惠 特 尼 威 尔 克 松 穆 和 检验 (Mann-Whitney-Wilcoxon rank sum test) , 电 一 惠 特 尼 
检验 法 。 


一 、 秩 和 检验 的 基本 原理 


如 果 要 比较 两 个 独立 样本 的 差异 性 ,所 给 条 件 又 不 符合 1 检验 的 要 求 , 这 时 可 以 采用 
秩 和 检验 法 。 这 是 一 种 检验 功效 极 强 的 非 参 数 检验 方法 ,适用 于 两 个 独立 样本 的 资料 。 

秩 和 检验 的 基本 思想 是 : 如 朵 两 个 样本 的 观察 值 没 有 显著 差异 , 把 这 两 组 观察 值 
放 在 一 起 来 排序 ,总 体 来 说 , 两 个 样本 中 的 观测 值 所 占 的 地 位 数 也 应 该 没有 差异 。 
换 句 话说 , 如 果 两 个 样本 来 自 同一 总 体 , 两 个 样本 的 观察 值 的 位 次 就 应 当 分 布 均匀 ， 
就 不 会 出 现 一 个 样本 中 的 观测 值 集中 在 高 位 次 、 男 一 个 样本 的 观测 值 集中 在 低位 次 的 
情况 。 

设 有 两 个 独立 样本 的 容量 分 别 为 mw 和 wn;。 为 了 叙述 方便 ,我 们 设 定 nn 三 nw;。 就 是 
说 ,两 个 样本 的 容量 可 以 相等 也 可 以 不 相等 ,如 果 不 相等 , 则 较 小 样本 的 容量 记 为 n, 。 当 
我 们 把 两 个 样本 中 的 所 有 观察 值 由 小 到 大 排序 时 ,各 个 观察 值 排 列 的 位 次 称 为 秩 ;各 个 
样本 中 所 有 观察 值 对 应 的 秩 的 总 和 称 为 秩 和 ,用 本 表示 。 如 果 两 个 样本 的 观察 值 没有 显 
著 差 异 , 那 么 两 个 秩 和 了 的 大 小 就 会 比较 接近 。 反 之 ,两 个 秩 和 T 了 的 大 小 则 相差 较 大 ,可 
以 据 此 推测 两 个 样本 的 观察 值 有 显著 差异 。 


二 、 秩 和 检验 的 基本 步骤 


1. 下 册 唐 无 假设 与 研究 假设 

虚无 假设 Ho: 各 个 样本 所 分 别 代 表 的 总 体 分 布 位 置 相 同 ; 

研究 假设 Ha :各 个 样本 所 分 别 代表 的 总 体 分 布 位 置 不 完全 相同 

2. 纺 科 次 并 计划 和 姑 和 

将 两 个 样本 的 所 有 观测 值 混合 后 ,按照 由 小 到 大 的 顺序 排 成 1,2,…,n 个 秩 次 。 不 
同样 本 的 相同 观测 值 , 取 平均 秩 次 ;一 个 样本 内 的 相同 观测 值 , 不 求 平均 秩 次 。 将 容量 较 
小 的 样本 (mw ) 中 各 数据 的 秩 次 相 加 ,以 工 表 示 。 

3. 统计 竣 扬 

查 附 表 12* 秩 和 检验 表 ” 得 到 本 值 的 临界 区 间 值 LT,T;j ,着 T 三 六 或 T 三 T;, 则 说 
明 两 个 样本 的 差异 量 达到 了 显著 性 水 平 ;车 T 二 本 二 T; , 则 说 明 两 个 样本 的 差异 量 未 达 
到 显著 性 水 平 。 

【 例 13 -3】〗 某 学 校 两 个 教学 班 采用 不 同 的 教学 方法 进行 数学 教学 ,经 过 一 个 试验 
周期 后 , 抽 测 11 名 学 生 的 数学 成 绩 , 结 果 如 下 : 
甲 班 学 生 的 数学 成 绩 :76,77,79,81,88 
乙 班 学 生 的 数学 成 绩 :78,82,85.86,89,91 
问 两 种 教学 法 的 教学 效果 有 无 显著 性 差异 ? (检验 显著 性 水 平 a 二 0. 05) 
【 解 】 
首先 ,提出 虚无 假设 与 研究 假设 , 即 : 
虚无 假设 Ho: 两 种 教学 法 的 教学 效果 无 显著 差异 ，; 


研究 假设 Ha :两 种 教学 法 的 教学 效果 有 显著 差异 。 


然后 编 秩 次 表 和 计算 较 小 样本 的 秩 和 :将 两 班 学 生 的 数学 成 绩 混合 后 ,按照 由 小 到 


大 的 顺序 排列 , 求 出 对 应 于 每 一 个 观测 值 的 秩 次 ,如 表 13-3 所 示 。 
表 13-3 两 个 样本 中 各 观测 值 的 秩 次 





乙 班 78 82 85 86 89 91 


计算 可 以 得 到 较 小 样本 的 秩 和 :T 一 1 十 2 十 4 十 5 十 9 一 21 。 


查 附 表 12, 得 芒 ==5,n: 二 6 时 ,T= 二 19,T; 一 所 ,所 以 本 例 中 Ti 一 T 一 T: ,两 个 样本 
的 数据 差异 未 达到 显著 性 水 平 , 可 以 认为 两 种 教学 法 的 教学 效果 差异 性 未 达到 统计 学 上 


的 显著 性 。 


当 两 个 样本 容量 都 大 于 10 时 ,一般 认 为 秩 和 工 的 分 布 接近 正 态 , 其 平均 数 和 标准 差 


如 下 : 


_ (mn 十 ma 十 1) 
Wr 2 


m7ta (HI + ny 1) 
I ee 


其 中 加 为 较 小 的 样本 容量 , 即 MI Sn ,这 样 ,检验 统计 量 为 : 


= 1 


Or 


【 例 13 -4】 在 一 项 无 意义 音节 记忆 实验 中 ,14 名 男生 (nm;) 在 一 定 的 时 间 内 , 记 住 的 
无 意义 音节 的 保存 数量 为 :19,23,26,24,28,27,23,24,29,25,30,18,25,24;11 名 女性 被 
试 (m) 记 住 的 无 意义 音节 的 保存 数量 为 :25,23,27,20,21,18,22,18,17,31,30。 问 无 意 


义 音节 的 保存 数量 是 否 有 性 别 差异 ? 


【 解 】 将 两 组 实验 数据 混合 从 小 到 大 排序 ,然后 标 出 男生 、 女生 每 个 人 相应 的 秩 次 。 


(公式 13=-7) 

(公式 13-8) 第 
下 
章 

《公式 13-9) 者 
参 
数 
检 
验 
Dod 
bd 
HH 
. 


结果 男生 分 数 的 秩 次 依次 为 :5,10,18,13,21,19. 5， 10,13,22,16,23.5,3,16,13; 女 生 分 


数 的 秩 次 依次 为 :16,10,19.5,6,7,3,8,3,1,25,23,5。 
根据 定义 ,女生 的 秩 和 为 ; 
T= 二 16 十 10 十 19. 5 十 6 十 7 十 3 十 8 十 3 十 1 十 25 十 23, 5 三 122 


因为 本 例 中 的 两 个 样本 的 容量 均 超过 10, 所 以 可 以 近似 地 采用 正 态 分 布 来 检验 。 


_ 轴 (ii 十 加 十 1) 11X(Ci 士 1413 
全 2 四 2 到 


_ [mmfmtl)_ /XIXCITITD -~ 
ci 一 /7 


其 中 为 较 小 的 样本 容量 , 则 有 : 


RS 1. 149 


两 样本 的 差异 未 达到 显著 性 水 平 ,可 认为 无 意义 音节 的 保存 量 未 出 现 显著 的 性 别 
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秩 和 检验 对 样本 具体 观察 值 的 相互 关系 予以 关注 , 比 符号 检验 法 对 数据 信息 的 利用 
率 高 , 故 其 检验 效能 较 高 。 在 正 态 总 体 下 可 达 上 检验 效率 的 95%。 而 在 偏 态 分 布 总 体 
下 ,其 检验 效能 一 般 高 于 上 检验。 


第 五 节 中 位 数 检 验 


一 、 中 位 数 检验 的 基本 原理 


中 位 数 检验 (median test) 与 秩 和 检验 的 适用 条 件 基本 相同 ,是 适合 于 两 个 独立 样本 
数据 差异 性 的 一 种 非 参 数 检验 方法 。 

中 位 数 检验 的 基本 思想 是 ;如 果 两 个 样本 的 观察 值 没有 显著 差异 ,那么 把 这 两 组 观 
察 值 合并 放 在 一 起 ,各 样本 中 的 数据 在 共同 中 位 数 的 上 、 下 应 各 有 一 半 ; 反 之 , 则 说 明 丙 
个 样本 存在 差异 ,不 是 来 自 于 同一 总 体 。 但 是 在 应 用 中 位 数 检验 时 ,实际 上 是 将 中 位 数 
作为 集中 趋势 的 量度 ,因而 其 虚无 假设 为 :两 个 独立 样本 是 从 具有 相同 中 位 数 的 总 体 中 
抽取 的 ,可 以 是 双 侧 检验 或 单 侧 检 验 。 双 侧 检验 结果 若 有 统计 学 意义 ,意味 着 两 个 总 体 
中 位 数 有 差异 (并 没有 方向 ) ; 单 侧 检 验 结果 车 有 统计 学 意义 , 则 表明 研究 假设 “一 个 总 体 
中 位 数 大 于 另 一 个 总 体 的 中 位 数 "成 立 。 


二 、 中 位 数 检 验 的 基本 步骤 


1. 规 上 出 鹿 无 假设 与 研究 假设 

虚无 假设 Fo: 各 个 样本 所 分 别 代表 的 各 总 体 分 布 位 置 相同 ; 

研究 假设 Hs :各 个 样本 所 分 别 代表 的 各 总 体 分 布 位 置 不 完全 相同 。 

2 . 俘 间 雁 序 并 计 算 共 同 挤 中 位 阁 

将 两 个 样本 的 所 有 观测 值 混合 后 ,由 小 到 大 排序 , 找 出 它们 共同 的 中 位 数 。 

3. 列 四 奉 责 

分 别 找 出 每 个 样本 中 大 于 共同 中 位 数 及 小 于 共同 中 位 数 的 数据 个 数 , 列 成 四 格 表 。 

4 . 统计 挫 断 

对 四 格 表 进 行 x* 检验 。 若 x 检验 结果 显著 , 则 说 明 两 个 样本 的 集中 趋势 (中 位 数 ) 
差异 显著 。 

【 例 13 - 5】 假设 某 医疗 研究 机 构 研 制 了 一 种 治疗 儿童 多 动 症 的 药物 ,为 了 试验 此 
种 药物 是 否 有 效 , 研 究 人 员 筛 选 了 20 名 多 动 症 儿童 参加 试验 。 为 了 试验 的 实施 ,他 们 编 
制 了 甲 , 乙 两 套 学 习 材 料 , 这 两 套 材料 经 检验 在 难度 等 方面 相当 ,以 分 别 用 于 前 测 和 后 
测 。 为 了 更 可 虞 地 进行 比较 ,他 们 选取 了 年 龄 相近 的 某 个 年 级 一 个 班 的 学 生 (30 人 ) 作 为 
对 照 组 。 实 验 分 三 个 阶段 进行 :第 一 阶段 是 实验 组 和 控制 组 均 使 用 甲 套 材 料 进行 前 测 ， 
即 均 在 同样 长 的 时 间 里 学 习 材 料 甲 ,然后 检测 学 习 成 绩 ;第 二 阶段 ,多 动 症 儿 童 接受 药物 
治疗 ,而 控制 组 不 接受 ;第 三 阶段 是 两 个 组 儿童 各 自 都 学 习 材 料 乙 并 进行 学 习 效 果 的 测 
试 ,这 是 后 测 。 试 验 的 结果 如 表 13 -4 所 示 。 


表 13 -4 不 等 组 实验 组 控制 组 前 测 后 测 设计 研究 数据 
实验 组 控制 组 





【 解 】 假设 两 个 样本 X 和 Y 是 来 自 有 相同 分 布 的 总 体 , 于 是 可 以 认为 来 自 X 的 随 
机 样本 XL ,Xi ,KX ,Xn 和 来 自 Y 的 随机 样本 YY， 、Ys Ya 、……… \Yaz 的 中 位 数 也 应 该 
大 致 相同 。 如 果 两 个 样本 的 中 位 数 差异 较 大 , 则 应 否定 两 总 体 X 和 YY 取 值 的 平均 状况 相 
同 的 假设 ,或 者 说 X 和 了 不 具有 相同 的 分 布 律 。 

步骤 1: 计 算 实 验 组 X 的 后 测 与 前 测 的 差异 量 ,控制 组 Y 的 后 测 与 前 测 的 差异 量 : 

Xi 5 -2 WW 0 15 15 10 13 15 10 20 .20 ZOD 
25 10 

YS = 0 5 0 5 1 3 & 10 1 Wmen LO 
= 


山川 十 器 


CDT LT Da 


LT 性 癌 印 郧 症 印 灯 磊 卫 莹 隐 


步 又 2: 计 算 样 本 X 和 样本 Y 的 数据 合并 后 数据 的 中 位 数 mm : 

按 从 小 到 大 的 顺序 排列 侣 并 样本 的 数据 ; 

人 
0 I 0 “18. 0. 0. 15 -15 “15 “9 438 "9 18 TB ‘18 
15 "15 18. .20 20 220. 28 2 5 6 

计算 合并 样本 的 中 位 数 得 到 mm 二 10. 00。 

步骤 3: 统计 出 X 样本 和 YY 样本 中 大 于 和 小 于 m 的 个 案 数 ,如 表 13 -5 所 示 : 

表 13-5 两 组 成 绩 中 位 数 的 卡 方 检验 用 表 
组 别 二 m 的 个 数 。 三 m 的 个 数 合 计 


实验 组 a 一 11 b=9 20 
控制 组 c=8 d=22 30 
合 计 19 31 50 
于 是 得 到 卡 方 值 : 
N(ad—bc)’ 


2 一 一 一 一 一 一 一 一 
a PP Vp Te ep op | 


当 df=1 时 , 查 附 表 9%“X 分 布 临 界 值 表 ” 得 到 x: ,. 一 3. 84， 所 以 本 研究 中 好 2 二 
论 ， ,样本 X 和 样本 Y 在 前 测 和 后 测 的 成 绩 变化 具有 显著 性 差异 ,表明 引 人 的 实验 处 理 
对 实验 组 产生 了 明显 影响 。 从 具体 数据 可 以 看 出 ,实验 组 的 后 测 成 绩 更 明显 的 高 于 前 测 
成 绩 , 因 此 可 以 说 ,多 动 症 儿童 在 服用 药物 之 后 其 学 习 成 绩 提高 的 幅度 比 控制 组 儿童 成 
绩 提 高 的 幅度 要 大 。 

需要 注意 的 是 ,如 果 任 何 一 个 单元 格 中 期 望 次 数 低 于 1, 或 者 有 超过 20% 的 单元 格 
中 的 期 望 次 数 低 于 5 时 ,就 不 能 使 用 中 位 数 检验 法 。 


第 六 节 非 参 数 检验 的 SPSS 过 程 


我 们 还 使 用 上 述 例题 的 研究 模式 和 数据 形式 说 明 其 SPSS 过 程 。 


一 、 符 号 与 符号 秩 次 检验 的 SPSS 过 程 


FT 2 VS 
SPSS 过 程 。 根 据 表 13 - 1 中 的 数据 建立 SPSS 数据 文件 。 该 数据 文件 应 该 包含 15 个 个 
案 行 ,2 个 变量 列 。 两 个 变量 列 分 别 为 前 测 和 后 测 心率 ,分 别 记 为 xl 、x2。 

单 击 “Analyze” 选 择 “Nonparametric Tests” 中 的 "2 Related Samples... "命令 ,打开 如 
图 13-1 所 示 的 对 话 框 。 

从 对 话 框 上 左边 变量 表 列 中 选中 配对 的 两 个 变量 xl 和 x2, 单 击 “ 国 加 "将 其 置 人 
“Test Pairs List” 下 面 的 方 框 中 , 勾 选 对 话 框 上 的 “Sign” 项 可 以 输出 符号 检验 结果 、 
色 选 “Wilcoxon" 项 可 以 输出 符号 秩 次 检验 结果 。 然 后 单 击 "OK" 按钮 即 可 输出 分 析 








图 13-1 符号 与 符号 秩 次 检验 对 话 框 


本 例 中 输出 的 符号 检验 结果 如 表 13 -6 和 表 13 -7 所 示 。 
表 13-6 正 负 号 的 频次 表 (Frequencies) 











N 
= Negative Differences 2 于 
,Positive Differences 13 2 
Ties D 章 
Total 15 非 
从 表 13 -6 可知 ,后 测 数 据 减 前 测 数据 ,所 得 结果 为 正 的 有 13 个 ;为 负 的 有 2 个 。 ~ 
表 13-7 符号 检验 结果 (Test Statistics) 和 
Ld 
X2 = X1 ? 

Exact Sig. (2 ~ tailed) ,O07 





从 表 13 -7 可知 ,p==0.07 二 0.01, 符 号 检验 的 结果 说 明 两 个 相关 样本 数据 的 差异 达 
到 了 0.01 的 显著 性 水 平 。 
符号 秩 次 检验 是 按 维尔 克 松 (Wilcoxon) 检 验方 法 进行 的 ,结果 如 表 13 -8 和 表 13 -9 
所 示 。 
表 13 -8 的 结果 显示 ,差异 量 为 正 值 的 平均 秩 次 为 2.75、 差 异 量 为 负 值 的 平均 秩 次 
为 8.81。 
表 13-8 符号 秩 次 表 (Ranks) 


N Mean Rank Sum of Ranks 








X2 一 Xl Negative Ranks 2 人 5. 50 
Positive Ranks 13 8. 81 114. 50 
Total 15 


Co、 一 


S09 279 


表 13-9 符号 秩 次 检验 的 结果 (Test Statistics) 








X2 X1 
Z "3, O07 
Asymp. Sig. (2 ~ tailed) 0.002 


表 13 -9 的 结果 为 维尔 克 松 符号 秩 次 检验 的 结果 ,结果 显示 p 一 0.002 一 0. 01 两 个 相 
关 数 据 样本 的 差异 性 达到 了 0. 01 的 显著 性 水 平 - 


二 、 秩 和 检验 的 SPSS 过 程 


数据 说 明 两 个 独立 样本 的 非 参 数 检验 一 一 曼 - 惠 特 尼 U 检验 过 程 。 
是 供 的 数据 建立 数据 文件 ,该 数据 文件 包含 一 个 分 组 变量 (group) ,一 
个 观测 变量 (acore)， 共有 11 个 被 试 ,其 中 组 1 有 5 个 .组 2 有 6 个 。 

单 击 *Analyze” 选 择 “Nonparametric Tests” 中 的 "2 Independent Samples... "命令 , 打 
开 如 图 13 -2 所 示 的 对 话 框 。 





守 莹 模 己 


一 本 世 喇 帮 吕 人 圭 





图 13-2 两 个 独立 样本 的 秩 和 检验 对 话 栓 


将 分 组 变量 添加 到 “Grouping Variables” 下 的 方 框 中 并 设置 拟 比 较 的 两 个 组 的 变 
量 值 ,将 观测 变量 置 人 *Test Variables List”" 下 的 方 框 中 , 勾 选 对 话 框 上 的 “Mann- 
Whitney U" 项 ,如 图 13 - 2 所 示 , 单 击 "OK” 按 钮 即 可 输出 结果 ,如 表 13 - 10 和 表 13-11 








所 示 。 
表 13-10 两 个 数据 样本 的 秩 次 和 (Ranks) 
GROUP N Mean Rank Sum of Ranks 
SCORE 1. 00 5 4., 20 21.00 
2.00 6 :1.50 15. 00 


Total 11 


Rs 


从 表 13 - 10 所 示 的 结果 可 知 ,两 个 独立 样本 数据 的 秩 次 和 分 别 为 21.0 和 45.0。 
表 13-11 秩 和 检验 的 结果 (Test Statistics) 


SCORE 

Mann-Whitney U 6. 000 

Wilcoxon W 21. 000 

Z 一 1.643 

Asymp，Sig，(2 -tailed) .100 

Exact Sig, [2* (1 tailed Sig. )] “1126 


从 表 13 -11 所 示 的 结果 可 知 ,两 个 独立 样本 观测 值 之 间 未 达到 显著 性 差异 (z 一 
0. 100>0. 05).。 


三 、 中 位 数 检验 的 SPSS 过 程 

串 后 13 - 5 | 的 数据 说 明 两 个 独立 样本 的 非 参 数 检验 一 一 中 位 数 检验 过 程 。 

根据 表 13 -4 提供 的 数据 建立 该 数据 文件 包含 一 个 分 组 变量 Cgroup) 一 
on 一 人 并 50 个 被 试 ,其 中 组 1 有 20 人 ,组 2 有 
30 人 。 建 立 数据 文件 后 ,使 用 * Tra 中 的 “Compute" 命 令 计算 后 测 成 绩 的 增 
量 , 即 以 后 测 成 绩 减 去 前 测 成 绩 得 到 增 量 , 记 为 变量 " score”。 


单 击 *Analyze" 选 择 *Nonparametric Tests” 中 的 “K Independent Samples... “命令 ， 
打开 如 图 13 - 3 所 示 的 对 话 框 。 


一 9 和 四 证 专注 大 庆 各 川 十 将 





图 13-3 独立 样本 间 的 中 位 数 检 验 对 话 框 


将 要 检验 的 变量 score 置 人 到 对 话 框 上 “Test Variables List” 下 面 的 方 框 中 ,将 分 组 
变量 group 置 人 到 “Grouping Variables" 下 面 的 方 框 中 并 设置 变量 值 。 然 后 勾 选 -Medi- 
an” 项 ,再 单 击 "OK” 按 钮 即 可 输出 结果 ,如 表 13 -12 和 13-13 所 示 。 

从 表 13 - 12 可 以 看 出 ,SPSS 系统 将 两 个 独立 样本 的 数据 合并 在 一 起 ,计算 得 到 共 
同 的 或 混合 的 中 位 数 后 ,就 可 以 汇总 出 各 个 样本 中 的 观测 值 大 于 混合 中 位 数 的 个 案 数 、 


小 于 或 等 于 混合 中 位 数 的 个 案 数 ,形成 一 个 四 格 表 的 计数 资料 





甫 13-12 各 单元 格 中 的 频数 (Frequencies) 


GROUP 
2.00 1.00 
SCORE 二 Median 11 8 
一 一 Median 9 22 


表 13-13 中 位 数 检验 的 结果 (Test Statistics) 


SCORE 

N 50 

Median 10. 0000 
Chi-Square 4. 089 
df 1 

Asymp. Sig. .043 


从 表 13 - 13 所 示 的 结果 可 知 ,SPSS 输出 的 x* 二 4.089, 其 显著 性 水 平 p= 二 0.043 一 
0.05, 即 两 个 样本 在 成 绩 提 高 幅度 上 存在 显著 性 差异 。 


和 一旦 习 思 考 与 练习 题 一 pp 


1. 参数 检验 与 非 参 数 检验 的 主要 区 别 是 什么 ? 各 有 什么 优 缺 点 ? 
2. 秩 和 检验 过 程 中 ,为 什么 不 同 组 间 出 现 相 同 数 据 时 要 给 予 “ 平 均 秩 次 ”, 而 同一 组 
中 相同 的 数据 不 必 计 算 “ 平 均 秩 次 ”? 
3. 有 甲 、. 乙 两 位 评委 ,给 7 名 参赛 选手 的 评定 等 级 如 表 13 - 14 所 示 。 请 问 甲 . 乙 两 
人 评定 的 结果 是 否 具有 一 致 性 ? » 
表 13-14 两 位 评委 给 予 7 位 参赛 选手 的 评定 等 级 


TT TY Bel 
























4 号 
4 号 


1 号 
2 号 


6 号 
5 号 


5 4 二 TT 
6 三 


4. 用 高 低 两 种 不 同 声音 信和 号 做 刺激 ,测量 被 试 的 选择 反应 时 ,10 名 被 试 的 反应 时 测 
量 结果 如 下 所 示 ,请 用 非 参 数 检验 方法 检验 :刺激 信号 音调 的 高 低 对 反应 时 是 否 有 显著 
性 的 影响 (a==0. 05)? 

高 音调 :365,372 ,382,394,403,412,428,439,446,481 

低音 调 ;376,388,389,391,409,411,437,439,456,458 

5. 请 10 名 被 试 评价 比较 两 种 果汁 的 质量 ,如 果 被 试 认为 第 一 种 果汁 的 质量 好 , 记 为 
“十 ”, 如 果 被 试 认为 第 二 种 果汁 的 质量 好 , 记 为 “一 ”。 评 价 比较 的 结果 如 下 , 问 两 种 果汁 
的 质量 是 否 有 差异 ? 

被 试 号 码 :1,2,3,4,5,6,7,8,9,10 





评价 结果 :十 ,十 ,十 ,0, 一 ， 一 ,十 ,十 ,十 ,十 
6. 由 10 名 员工 组 成 一 个 评估 小 组 ,每 个 员工 都 对 5 名 领导 管理 方式 的 优 劣 进行 排 
序 , 认 为 是 最 好 的 排 在 第 1 位 ,认为 是 最 差 的 排 在 第 5 位 ,结果 如 表 13 - 15 所 示 。 请 问 ， 
在 五 位 领导 之 间 ,评价 等 级 存在 显著 差异 吗 (c 一 0.05)? 试 采用 SPSS 系统 进行 分 析 。 
衷 13-15 对 五 位 领导 管理 方式 的 排列 等 级 








领 导 

员工 

A B C D E 
1 1 3 2 4 5 
2 2 3 1 5 4 
3 1 4 2 3 5 
4 1 2 3 5 4 
5 2 1 3 4 5 
6 2 3 1 5- 
7 1 2 4 : 
8 5 1 9 
9 1 2 yg 
10 2 1 \ 
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附录 “常用 统计 检验 用 表 
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附 下 3 + 值 囊 ( 单 观 侧 检 验 ] 


( 章 侧 性 验 用 ) 
0. 25 D0, ID 0. 05 D0. O25 0. 1 D0. M05 
( 双 侧 粒 验 用 } 

df 0. 50 .20 0.10 心 . 05 0. O02 0.01 
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附 各 二 Fwma 的 临界 值 ( 喧 特 羔 方差 齐 性 检验 ) 
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让 TS 
时 全 
La 


6°9F 
9 9 
a Fh 
BF 
站 


站 并 
9 "BE 
8 LE 
点 和 
人 


‘ 尝 洲 } 


其 哈 ” 磋 匡 夫 本 党 遍 于 朵 二 二 





率 基 裔 阴 其 隐 二 莉 维 二 平 这 


IP 


301 


i 
于 


Ld le 


囊 10 符号 检验 家 





往 : 此 表 为 单 测 检 驻 ,双人 刷 检验 的 概率 应 为 .02.. 10. 20。 


附 表 11 符号 秩 次 检验 赛 


单 侧 检 验 显 著 水 准 


双 删 检验 显著 水 对 





.D1 


证 重 曾 强 术 斑 辽 苹 了 于 淄 泗 提神 盘 


附 囊 12 鞭 和 检验 惠 





[he 


二 六 河 国 印 印 石 蔓 灯 剧 平 获 桂 






注 : 表 中 数值 上 向 表示 . 025 显著 性 水 平 :下 行 表 示 . 05 显著 性 水 平 。( 此 表 为 单 侧 检验 ) 


附录 “常用 统计 检验 用 表 


附 表 1 随机 数字 串 





RowzCaol 全 国 | 2) (3) LE (5) CH} (7) (B (9 19) 





O000 10097 32543 -76520 13586 34673 S4876 80959 09117 -39292 ?74945 
Doool S7542 DABOS -64894 T4296 24805 C24037 20636 10402 O0822 91665 
Dongz2 DBd22 68953 lI9645 Og303 -23209 02560 15953 34764. 35080 34606 
人 DOD03 99019 002529 - 09376 frI5 “38311 41165 88676 ra97 D436 -27659 
O00d l2807 99970 80157 -3647 64032 36653 C98951 lB877 12171 ?6833 


D0005 6065 T4717 34072 T6830 36697 36170 -65813 39885 Il1i99 29170 
Dooo6 10OB0 loBDs 957] B206 35303 426]4 -86799 O7439 -23403 09732 
Dono7 SoaBD i602 O205] 65692 C68B665 T4818 73053 B85247 1B623 -B8579 


Ea 


DonOS 63573 32135 05325 A7048 S0553 S7548 28468 28709 C8349] 25624 
DO 站 全 中 了 7 5 Ba273 35 


nonlo 900 17767 ld305 68607 -22108 40558 60970 93433 50500 73998 
DoOdll ll80s D544] 39808 27732 S07T25 C68248 C29405 24201 S2775 67851 
DoD12 曲直 和 99634 O6288 08083 l37da6 ?O07E 18475 40610 687]1 77817 
DOVIs B8685 -40200 BGS07 -58401 36766 -G795] S0364 T6493 29609 11062 
Do0lad 99594 67348 87517 G4969 -981826 O8928 93785 G1368 -23478 34113 


i 酒 半 区 多 印 果 徘 玫 和 蓝 量 


D0015 65481 17674 jr468 S0950 S8047 76974 T3039 7186 -A0218 16544 
O0016 BOl24 -35645 Irier O80ls 453]8 22374 21]1lls 78253 14385 53763 
00017 v450 998]7 TIA402 77214 C43246 DID 4542] Gl237 -96286 -02655 
DAULS 9916 -26803 66252 29]48 336046 B7204 T7662] 13990 -94400 56418 
D0019 D893 20505 1 225 站 有] 和 6d27 S6788  g6297 T78822 54382 14598 


DoD2U 号 】 生 电机 14523 B8479 55 94750 -89923 37089 20048 
Dnon2l B0336 94598 26940 -36858 70297 34135 53140 -33340 120650 “82341 
D0022 9404 81949 B51lar 47954 32979 26575 57600 -4088] 22222 O413 
DOD2s l2550 -73742 11100 02040 Il2880 TAG97 -96644 89439 28707 25815 
63606 -9329 16505 -34484 40219 S2563 43651 TOBE O7207 F1790 








Row/taol 


OOO25 
0026 
DO027 
OOO028 
OOD29 


Gonav 
D0031 
D003 
00033 
DO034 


0035 
ON036 
NODS7 
00038 
00039 


O0040 
Oond] 
D004d2 
0043 
DO 


D00045 
O0046 
DooA47 
DMO 
O0049 


61196 
]S 站 ?4 
B57 
42481 
业 呈 上 再 


站 本 993 
D549 
35963 
S9808 
二 让 问号 号 


32179 
69234 
19565 
本 号 了 与 可 
加 半 吕 恒生 


98086 
33185 
8B0951 
79752 
18633 


26457 
95270 
BTBOT 
7344 
T3208 


业 了 了 7 时 
T0953 
S4487 
DB721 
BO 


33824d 
B8159 
D9354 
26842 
D92286 


20241 
| 
T75379 
站 7 立 册 厂 
1085] 


之 BBD 和 4 
S049 
?O774 
28296 


99367 
和 22 
16868 
B84 


已 T7229 
B3848 
直 44431 
48767 
D1416 


51025 
3896 
5462 
49700 
D077 


DTOOT 
O00DV 
21585 
5443 
81554 


EBD6 
8581 
23387 
02591 
下 生硬 了 


5394 
Bad96 
91190 
03071 
2625 


B1962 
名 44462 
77974 
13021 
93910 


86743 
工 各 了 下 寻 
B6674 
39047 
01340 


39094 
BEGYS 
25016 
F452 
D5435 


S2527 
S6127 
9973 
942307 
10518 


59599 
10118 
42592 
12059 
29663 


?9335 
B2391 
S0024 
号 半 吕 2 
8367 


17157 
9 
3 
O03 
35456 


T3407 
二 让 生生 下 
S0298 
20599 
B1427 


5802] 
19255 
要 dd 站 
S7546 
21616 


39d441 
时 7 了 75 
a 
D0387 
77938 


B08 1 
36040 
冲击 寺 和 丰 ] 
15020 
恬 ] 外 4 吕 


当日 于 二 
20106 
引 室 和 9 机] 


11838 
96338 
85207 
9541 
51176 


31880 
73043 
B1171 
S57 
1936 


51748 
0329 
23456 
习 9994 
T6938 


量规 填 和 H 放 启 半 举 洱 持 济 尝 
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i 
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生硬 吕 可 久居 半 委 请 






附 表 2 正 恋 分 布 的 EPZY 转换 表 
{ 曲 此 下 的 面积 巨 与 儿 南 了 ) 


11791 
:12172 
12552 
2 3D 
134307 









32918 
.B2713 
.32506 





















.13683 
:14058 


. B2297 
,二 了 性 全 让 
| 
,41659 
.3]443 














:1228 
.31006 
. 30785 
. 30563 
.D399 











30114 
29887 
9 
.9431 
:0 















.39104 
9024 
,38940 
,38853 
-38762 


. 28969 
Bia 
-28504 
， 28269 
3， 


























. B667 
32568 
:38466 
. 38361 
,38251 


, 20884 
全] 之 
21566 
: B19 
,0 





.27 708 
27562 
ee 
-27986 
. 2884 







































.25907 
:2237 
23565 
,于 站 日] 


, 24215 
24537 
. 24857 
2H 
。 259 


.BO 
.E15 
2d 
.26730 
27035 


27337 
.27647 


27935 


: 28230 
.208524 


.288 
. 29103 
,29939 
. 290673 
, 255 
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3051] 


DT 
. 31057 
,31427 














33]185 和 9 

































































































. 32121 43574 

. 32381 43699 

. 32639 43822 

.12001 43943 

. 39617 .11816 44062 

.390796 .11632 | .44179 

.39973 44295 

.40147 二 

.40320 .11092 44520 

. 23955 .0490 . 10915 44630 
, 23713 . A0658 .10741 44738 
. 23471 . 40824 .10567 44845 天 
, 23230 ,40988 .10398 44950 
计 
.22988 .41149 .10226 | ,45053 。 性 
.22947 .41309 10059 45154 
, 22506 .41466 .D9893 45254 时 
. 22265 ,41621 .09728 | .45352 和 
















:22025 





a Ll 。 准 与 半生 9 












-21785 





时] 各 
,是 2 和 7 
直达 


.DO4Ds 
4 
. 00089 


,9543 
















.13546 





:45637 
+:5728 
5018 
-5907 








21307 
.21069 
.2D831 




















.14350 
144146 


. 生 29 和 6 
,2007 


, GBIF 
TD 





















2 :二 





-4278 





.D8478 












; 42922 .08329 
.08183 


,DEO 









,30056 
.3189 





忆 。 


生硬 硬 恒 河 半 而 抱石 芒果 炜 下 时 章 


四 
-O7614 
: D7477 
“O734] h 0 .D404 1 


-D7206 :和 |: .D495 
:TT F ' D387] 
"D9d | 4 i . D3788 :48500 
-QEA1A 。 .O3706 -448537 
.DBRT . .D4626 48574 


,D6562 
.D649 
.M6316 
. D6195 
. D607T 









. D3174 
:D3103 
， D309d 
.02965 
. D2898 


.9061 
,9086 


.49111] 


,49134d 
.9158 














.286 
.305 
了 | 
了 
,361 


,379 
-号 本 生生 
,二 旦 二] 二 
:3 
。 引 习 半 和 而 


了 | 
,77 
92 
:D6 
-520 


和 


由 :对 如 外 上 


















.O43 




























. 00430 ,49953 

,00417 ,49955 

.00405 .49957 

.00393 . 490958 

.O0381 | . 49886 49960 

.00370 | ,49889 49961 

.00358 | .49893 49962 

.00348 | .49897 49964 

.00337 | .49900 .Do127 49965 

.D0327 | .49903 49956 

.D0317 | .49906 49968 

.00307 | ,49910 49969 和 

.00298 | .49913 49970 

.00288 ,916 49971 用 
绩 
计 

.00279 | .49918 . 00104 49972 

.00271 | .49921 .06100 | .49973 本 

.00262 | .49924 .00097 49974 

.00251 | .49926 .00094 3 







-D0246 ;2 ,00090 







:O02a 





.9931 
| 
, 49936 


, OOOBT 





.DO231 
,O22 


.DUOB4 






, 449825 
9383] 


: DOOS] 
.0079 









-DO216 9938 













， 利生 如 呈 让 .和 1 + 寺中 号 半 性 .00076 






. O0203 
,DOLD6 


。 全 中 站 卫 :OOOF3 






- 导 避 日本 : DOOF1 









-DOL90 :99 . DOO6S 






.DOLE :994 : DO0G6 





.D0178 :时 995 . O06 





全 - 


LL 


290 


:O047 


:00046 
:OOD44 





附 下 3 + 值 囊 ( 单 观 侧 检 验 ] 


( 章 侧 性 验 用 ) 
0. 25 D0, ID 0. 05 D0. O25 0. 1 D0. M05 
( 双 侧 粒 验 用 } 

df 0. 50 .20 0.10 心 . 05 0. O02 0.01 
1 1. O00 3. 078 6. 314 12. 706 31. Bel B34. 657 
2 0. 816 1]. B86 2. 920 .303 6. 965 ,925 
3 0. ros 1. 638 2, 353 9. 182 本 ,互生 | 5, B41 
和 0, ?#1 1.533 2 132 2.776 3.747 二 。 人 4 
5 0. 727 1 476 2. D1s 2.571 9, 365 生 . D32 
6 0. 718 1] 下 4 ], 和 9 和 3 名, 二 由 旦 ; ] 币 击 号 7 了 
? ?1] 1.415 1, 893 2. 365 2 998 二 引 99 
名 ?06 1.397 1. B60 2 3306 2. B96 3.355 
9 F703 1. 383 1. 333 之 , 儿 站 这 2. B21l 3. 250 
10 700 1. 372 1.812 2. 228 2 764 3. 169 
11 B97 1. 363 1. 798 2. 201 2.718 3. 106 
12 695 1.398 .YE 2,179 2. 681 055 
13 [EH ]. 350 1. 771 2 160 ”2.650 D1l2 
1 692 1,345 1]. ?61 2. 145 2 B24 977 
15 691 1. 341 1]. ?33 2.131 2. BO2 Bd 
18 6 1.337 1. 746 2, 120 2. 53584 921 
17 89 1 343 1 7 2. 110 2, 567 B98 
18 688 1, 330 1. 734 101 2 B78 
19 B88 1. 328 1 729 093 2.539 B61 
20 B87 1], 28 1. 725 O86 2. 528 是 

2 


生 生生 者 泪 上 请 部 千 清 末了 珀 浊 树 





2 上 上 分布 分 位 数 表 


?1 si (1 
Fp T) 一 一 -一 一 并 
ee a 了 





> 0.5000 0.5500 0.5900 0D.6509 


D.7000 0.7500 v.8000 0.8500 0D.9000 8.9200 


» “和 » 2 
和 Go Dr co Do -0 CE 一 
有 ‘ . 

3 





1 0.00000 [0.13838 0.32i92 0.50953 DO.72654 3.00000 1.37638 1.86261 3.077é28 56 
2 O00000 0.142135 0.28888 Ona4i75 061721 0.51650 1.O6Cta 1.38621 1.885&7 2 
了 | 0.00000 0.13k60 0.0f667 0.42620 0.58439 0.76489 O978a7 1.zg988 1.6377 2 
4 | 9.00000 0.13383 0.27072 0.41410 0.56865 .74070 “0.94086 1.18957 1.53321 2 
3 | 0.00000 0.13218 0.26718 0.40823 0.55943 0.72669 0.91954 1.15577 1.47588 2 
5 | 900000 0.13105 0Q.26483 0.40531 0,25358 0,zt750 0.90579 1.13416 1.43976 i 
了 | 90.00000 0,13029 0.2631? 0.40154 0.54811 0.71144 0.89603 14.11916 1.4lage 1 
5 | 90.00000 0.12971 .ceél92e 0.39947 0.564593 0.70539 0.88889 1.19815 1.39882 4. 
9 | 0.00000 0.12923 0O.2eCG98 O39787 0.54348 0O.70272 0.88369 1.09972 1.38505 i 
10 | 9.00000 0.12889 0.o6018 0,.39659 0.54153 0.69981 0.87900 1.093058 1.57215 1 
1 D00000 0D.12859 0.25956 0.39555 0.93994 D69745 0Q.875535 1.09767 1.34343 1 
2 | 90,00000 CG.12833 0.25903 0.396647 0.55862 0.69548 0.8728] 1.05321 1.39622 1. 
13 | 0.00000 0.12814 0.25599 0.393595 0.53750 0.69383 O87015 1.07947 1.35017 1. 
14 | 9.J0000 0.12796 0.25821 0.39335 0.53555 O69e42 0.86805 1.07628 1.34505 1. 
15 | 0.00000 0.12781 0.25789 0O,392f9 0.53573 Q.69120 0.88824 107353 1.34061 1. 
13 | 9.000 0.12767 0.25760 0.39232 0.53501 OO.é9013 CG.86467 1.07114 ?1.335676 1. 
17 | 0.00000 0.12753 0.25739 0.39199 0.53¢58 0.68920 0.8632 1.06903 3.333538 上 
IB | 0,00000 0.12743 0.25r12 0.39155 0.55592 0.o8830 [5.86205 1.06717 1,33039 1, 
1]? | 0.00000 0.12733 0O.2sbyoe 0.39120 0.53331 OQ.e8r62 0.88095 1.06551 1.32773 1 
oe | 0.00000 012r2r 0.25674 0.39091 0.53285 0,68695 0.85995 1.06402 1.32534 1, 
21 0.J0000 0.12712 0.25028 0.39064 0.53248 ORBS3S 0.85907 1.08287 1.32319 1. 
22 | 0.00000 0.12712 O25643 0.39039 0.53208 C.£858] 0.85827 1.C8145 1.32124 1. 
3 | 0.00000 G12r0s 0.25630 0.39017 0.5%375 CG.688531 0.857535 1.Cé£034 1.31946 1. 
| 900000 0.12700 0.25617 0.38997 0.55344 CG.é8485 0.85686 1.05952 1.31784# 1. 
c | 0.00000 0.12694 0.25506 0.36978 0,53i15 C68443 VB5624 1.05838 1.31635 1., 
8 | 0.90000 0.12689 0.25595 0.38961 0.53089 C0.68404 9.85587 1.G5752 1.31497 1. 
ef | 0.J9000 0.12685 0.25586 0.38945 0.55065 0.68388 0.85514 1.05673 -1.31370 1, 
28 | 0.90000 0.12681 0.2527 0.38930 0.53042 0.688335 .85463 1.05537 1.31253 1. 
29 | 0.00000 “0.12677 0.25568 0.38916 0.53021 0.68304 0.854ls 1.05530 1.31143 1, 
309 | 0.00000 0.12873 0.25561 0.38903 0.53002 0,58276 0.85377 1.05a66 1.31042 1, 
32 | 90.30000 0.1c6t6 0.25546 0.38880 0.52967 0.58223 0.8530C 1.09550 1.30857 1. 
3 | 0.00000 0.12660 0.25534 0.38859 0.52935 0.68177 0.85232 1.05268 1.30685 1. 
3 | 90.00000 0.1ck55 0.25523 0.38841 0,.52908 0.68137 0.85172 1.05158 1.30551 4. 
38 | 0.00000 0.12850 0.22213 0.38823 0.52883 0.68100 0.85118 1.05977 1.30423 1. 
| 10.00000 G12648 0.25504 0.38810 0.52861 0.68067 0.85070 1.05005 1.30308 1. 
“5 | 0.00000 0.12637 OQ.25485 0D.38779 0.52514 0.67998 0.849€8 1.0c852 1.30065 1.67965 
3] | 0.00000 0.12830 9.25470 0.38754 0.5e776 0.57943 和 .84887 1.04729 1.29871 1.6 
22 | 0.00000 0.12624 O25458 0.38734 O52r745 0D.s789B 0.8482] 1.04630 1.29713 1 
的 | 0.00000 CG.1261? 0,.25447 9,38717 O52720 0.57860 0.84765 1.04547 1.29582 1.670 
$5 | 0.00000 0.12613 0.25439 0.38703 0.52698 O67828 O84719 1.04477 1.29471 -1.66B54 
7D | 0 0.12612 0.25431 9.3869] OQ.92680 9.57801 0.84679 1.044 和 1.29370 6669 
8 | 0.9 0.12606 0.05419 0.38671 QO.52650 人 .57757 站 .84615 .04320 1.092D2 1.65412 
30 | 0.J0000 0.12602 0.25410 09.38655 0.52626 O67723 0O.84563 ,di244 1.29105 1.66°96 
1c0 | 0.0 C12378 O2402 .38643 O52608 9.6695 QB84523 -11.0484 1.29007 11.80 
Tt10 | .0 0.12595 0.25396 0.386355 0.52392 O67673 0.84490 1.04134 1.28930 1, 
120 | 0.00000 0.12393 0.25391 0.38624 0.32580 0.07554 O84663 1.04093 1.25555 1 
150 ;8.00000 0.12387 0.23380 0.38606 O32532 0.07615 0.844g2 1.04003 1.28727 1 
180 ; 0.00000 0.12284 9.25372 0.38594 0.52533 0.47586 0.85302 1.03943 1.28627 | 
ca0 CC.00000 0.1237? 0.25363 0.38578 0.52510 0.67551 0.84310 1.05868 ,28509 1 
0.00000 0.12366 0.25335 0.38530 0.92440 .47449 03834102 1.03643 1.28155 1 
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附 品 4 下 值 表 ( 双 侧 检 验 ) 


人 








分 子 自由 度 -二 


$@ 兴 名 洲 必 邮 共生 站 可 排 淹 这 


i! 


19. 30 


|9; 0 





理 妆 和 三 酒 加 的 六 有 而 煌 昌平 划一 吉 - 


附 表 5 下 值 表 ( 单 侧 检 验 ) 
分 子 dj 


( 续 磺 ) 


谷子 号 F 


A A 


生生 二 看 放 酒 肯 剖 玫 车 酒 秆 





ea 


分 


di 





Ll ee 


【 续 甫 】 
他 于 可 让 
aonnoonorGirei 和 ni 


ea 


分 


di 





Ll ee 


【 续 甫 】 
他 于 可 让 
aonnoonorGirei 和 ni 


附 各 二 Fwma 的 临界 值 ( 喧 特 羔 方差 齐 性 检验 ) 
i 二 最 太 5 最 小 a 


k 一 变异 数 的 数目 
15.5 20.6 25.2 29.5 33.6 37.5 .4 444 让 48.0 51.4 
37. 49. 59. 的 79. 旭 97. 106. 113. 120, 


10.8 19.7 163 187 20.8 22.9 24.7 26,5 28.2 .9 
22, 28. 93, 38. 42. 明石 。 50。 4 Bs, BO, 


12.1 14.5 16.5 18 20, 22 23 24 26 27 
E00 105 11 17 12.2 12.7 
9 Il7F i192 14.5 15.8 16 17.9 1&9 19.8 21. 
附 
孙 
5.34 631 7.11 7.80 Bd4l 8.95 945 dol 103 -10,7 
85 dg 1 121 11 139 147 153 16.0 16.5 
统 
4 B67 GM Bo Td2 7T87 B28 B66 OL 8. 二 
Tl 118 1 13.9 
雪 
4.16 0 5 二 
6. 1 9 TT6 B22 7 lS 10.2 10.6 H 


3.54 0 7 5 5 A 577 


2.95 3.29 384 37 3 
3.8 半 . 了 半 . 而 9 5.1 EPE Bs 号 ,各 5.8 
2.40 2.61 祥和 EIT 0 .12 1 
3.0 和 9. 本 本 业 引 .各 a 了 .由 再 身 业 . 昌 ,1 
1 1 ED 1 2.17 二 
吕 四 2 2, 4 2. 5 5 2.6 2.6 2.7 


1.00 100 L000 Lo0 100 100 1.00 100 1.00 
1.00 oo0 100 1 的 100 100 100 1.00 1.%0 





附 吉 7 Fisher Zr 转换 囊 
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用 
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Ee 
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附 叶 3 积 差 相 关系 数 1r) 显 著 性 临界 值 吕 


a 三, 1]D 


:0 


外 痢 希 日 朵 于 时 内 斗 综 注 对 章 芝 


生生 和 酒 恒 划 旬 一 包 灯 怀 才 洲 半 局 





附 表 9 x 分 布 临 界 值 表 
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囊 10 符号 检验 家 





往 : 此 表 为 单 测 检 驻 ,双人 刷 检验 的 概率 应 为 .02.. 10. 20。 


附 表 11 符号 秩 次 检验 赛 


单 侧 检 验 显 著 水 准 


双 删 检验 显著 水 对 
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证 重 曾 强 术 斑 辽 苹 了 于 淄 泗 提神 盘 


附 囊 12 鞭 和 检验 惠 
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二 六 河 国 印 印 石 蔓 灯 剧 平 获 桂 






注 : 表 中 数值 上 向 表示 . 025 显著 性 水 平 :下 行 表 示 . 05 显著 性 水 平 。( 此 表 为 单 侧 检验 ) 


